
開(kāi)放與安全 大數(shù)據(jù)的“尷尬”博弈
手握大數(shù)據(jù),你能做什么?
消費(fèi)者,可以通過(guò)售后服務(wù)和投訴率等指標(biāo)貨比三家;商家,可以借助信息的公開(kāi)透明和諧相處、良性競(jìng)爭(zhēng);投資者,可以分析數(shù)據(jù)準(zhǔn)確找到自己想投資的項(xiàng)目……
有人說(shuō),數(shù)據(jù)就是生產(chǎn)力,在信息社會(huì),它將成為核心資源;有人說(shuō),雖然它還沒(méi)有被列入企業(yè)的資產(chǎn)負(fù)債表,但只是一個(gè)時(shí)間問(wèn)題……
大數(shù)據(jù),已然成為時(shí)下最火熱的IT行業(yè)熱搜詞,隨著數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等圍繞大數(shù)據(jù)商業(yè)價(jià)值的被利用,其逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。
只是,自古“忠孝兩難全”,凡事皆難兩全其美。當(dāng)央視315晚會(huì)大力度曝光Cookie采集用戶(hù)信息時(shí),當(dāng)人們因個(gè)人隱私被泄露而只能一聲嘆息時(shí),“風(fēng)光無(wú)限”的大數(shù)據(jù)遭遇了當(dāng)頭棒喝。福音還是災(zāi)難?一夜間,關(guān)于大數(shù)據(jù)的討論多了些許憂(yōu)心的成分,如何挖掘和使用數(shù)據(jù)?企業(yè)的道德底線(xiàn)瞬間被推上了審判的至高點(diǎn)……
大數(shù)據(jù)開(kāi)放才是硬道理
“大數(shù)據(jù)時(shí)代,是三個(gè)和尚在一起才有水喝?!睂?duì)于這一形容,阿里集團(tuán)數(shù)據(jù)委員會(huì)的會(huì)長(zhǎng)車(chē)品覺(jué)非常認(rèn)同,在他看來(lái),大數(shù)據(jù)行業(yè)本身非??简?yàn)技術(shù)和商業(yè)的同時(shí),也需要很多其他的東西結(jié)合起來(lái)之后才能用在數(shù)據(jù)上, 亦即利用數(shù)據(jù)拿到更多數(shù)據(jù),互惠互利。
為了更好地理解這一概念,在阿里媒體開(kāi)放日上,車(chē)品覺(jué)和我們分享了一個(gè)典型的故事。
一個(gè)海員,因?yàn)橐馔庖阉傻揭粋€(gè)地方去收集一些航海工具。當(dāng)時(shí),他發(fā)現(xiàn)這個(gè)地方有很多航海日志,可以提煉出不少數(shù)據(jù)化的航海背景,于是,他收集這些東西放在航海地圖上,以幫助將來(lái)出海的人做一些決策,而航海的人根據(jù)此地圖行動(dòng)后也必須要收集一些數(shù)據(jù)繼續(xù)完善,不斷反饋和糾正,在實(shí)踐中提煉數(shù)據(jù)的敏捷性,這本誕生于100年前的航海地圖就是我們今天追尋的大數(shù)據(jù),它具有數(shù)據(jù)體量巨大、數(shù)據(jù)類(lèi)型繁多、商業(yè)價(jià)值高和處理速度快等特點(diǎn)。
收集數(shù)據(jù)、應(yīng)用數(shù)據(jù),然后出現(xiàn)質(zhì)量問(wèn)題,層層反饋回去以建立更清楚的數(shù)據(jù)源。對(duì)于大數(shù)據(jù)而言,開(kāi)放似乎才是硬道理;對(duì)于很多企業(yè)來(lái)說(shuō),大數(shù)據(jù)管理其實(shí)是補(bǔ)10年前管理理念上的課。眼下,移動(dòng)互聯(lián)網(wǎng)與社交網(wǎng)絡(luò)的興起更是將其帶上了新的征程,但車(chē)品覺(jué)卻表現(xiàn)出了謹(jǐn)慎保守的態(tài)度。
“孤立的部分不能構(gòu)成整體,但處理開(kāi)放最大的難題就是數(shù)據(jù)安全,開(kāi)放是硬道理但安全也是重要的保障,在安全還沒(méi)搞清楚之前,開(kāi)放還需要等待。”在大數(shù)據(jù)行業(yè)踐行多年的車(chē)品覺(jué)再三強(qiáng)調(diào)現(xiàn)在談數(shù)據(jù)的開(kāi)放還為時(shí)尚早。畢竟,數(shù)據(jù)越大,問(wèn)題越大,數(shù)據(jù)安全問(wèn)題亦自云計(jì)算概念普及之時(shí)已被頻繁提上議程。
個(gè)人隱私遭泄露:數(shù)據(jù)開(kāi)放的另一頭是安全
網(wǎng)購(gòu)時(shí),包括家庭住址、電話(huà)等個(gè)人信息被商家一覽無(wú)余之時(shí)也被不法企業(yè)廉價(jià)販賣(mài);安裝手機(jī)APP,通話(huà)記錄、短信記錄、通訊錄成了隱私信息泄露的三個(gè)高危地帶……于是,各種陌生、欺詐電話(huà)應(yīng)接不暇;個(gè)性生活、消費(fèi)習(xí)慣更是被相關(guān)利益方了如指掌。小米科技CEO雷軍更是發(fā)出“手機(jī)丟了,比電腦丟了還恐怖”的感慨,如是說(shuō),越來(lái)越開(kāi)放的大數(shù)據(jù)已失去了重心?如何守住正義的最后這道防線(xiàn)成了商家必修的課題。
對(duì)于淘寶和阿里系,車(chē)品覺(jué)介紹稱(chēng),從內(nèi)部的情況來(lái)講,個(gè)人很重要的信息我們稱(chēng)之為敏感信息,從敏感信息來(lái)講,從收藏庫(kù)到倉(cāng)庫(kù)是隱蔽的,你是工程師或者在內(nèi)部開(kāi)過(guò)店有你個(gè)人的隱私,內(nèi)部安全把敏感數(shù)據(jù)隱蔽,不能讓一般人看見(jiàn)這個(gè)數(shù)據(jù),有些我們稱(chēng)之為機(jī)密性的數(shù)據(jù)就更嚴(yán)重一點(diǎn),在倉(cāng)庫(kù)里面都看不見(jiàn)這些數(shù)據(jù),這是隱秘性的。從應(yīng)用來(lái)講,要應(yīng)用這個(gè)數(shù)據(jù)需要遵守PRD原則,經(jīng)過(guò)內(nèi)部的評(píng)審,看有沒(méi)有侵犯到個(gè)人隱私,所以,從內(nèi)部來(lái)講對(duì)個(gè)人隱私方面還是相對(duì)保護(hù)比較多。
事實(shí)上,當(dāng)前大數(shù)據(jù)面前有三座大山,一是數(shù)據(jù)質(zhì)量作為底線(xiàn):如果原材料不可靠,將無(wú)法加以利用;第二,平衡數(shù)據(jù)安全與開(kāi)放,開(kāi)放是硬道理,但開(kāi)放最大的難題是數(shù)據(jù)安全。第三,落實(shí)數(shù)據(jù)化運(yùn)營(yíng),只有當(dāng)大量的員工懂?dāng)?shù)據(jù),用數(shù)據(jù)來(lái)決策業(yè)務(wù),才能說(shuō)明這家公司開(kāi)始啟動(dòng)數(shù)據(jù)化運(yùn)營(yíng)。
不可否認(rèn),數(shù)據(jù)開(kāi)放本身會(huì)產(chǎn)生力量,適當(dāng)?shù)拈_(kāi)放也會(huì)產(chǎn)生更多的想法,但如車(chē)品覺(jué)所言,開(kāi)放不一定是獲取數(shù)據(jù),可能是創(chuàng)新想法的交換,這比獲取數(shù)據(jù)更重要。
當(dāng)前,挖掘用戶(hù)的行為習(xí)慣和喜好、 幫企業(yè)做內(nèi)部數(shù)據(jù)挖掘或優(yōu)化、幫企業(yè)更精準(zhǔn)找到用戶(hù),降低營(yíng)銷(xiāo)成本,提高企業(yè)銷(xiāo)售率,增加利潤(rùn)……可以看出,雖然大數(shù)據(jù)目前在國(guó)內(nèi)還處于初級(jí)階段,但是商業(yè)價(jià)值已顯現(xiàn)出來(lái),誕生了新的商業(yè)模式的同時(shí)亦仿佛站在金礦上。
如何讓它有可參考性?“伴有主觀情緒在里面的數(shù)據(jù)需要清楚的告訴別人主觀判斷在哪里,比如我們看一些訪談,它會(huì)說(shuō),這個(gè)訪談是經(jīng)過(guò)調(diào)查兩千人后得到的結(jié)果,這種就是參考數(shù)據(jù)?!避?chē)品覺(jué)表示。
值得一提的是,無(wú)論如何,在隱私泄露這件事情上,消費(fèi)者是需要被保護(hù)的弱勢(shì)群體,商業(yè)也好,企業(yè)也罷,需要在開(kāi)放與安全中把握好一個(gè)“度”,可以說(shuō),這是一個(gè)良心的判斷。
阿里大數(shù)據(jù)還在路上
讓數(shù)據(jù)獲取、使用、分享、協(xié)同、連接、組合變得超級(jí)簡(jiǎn)單,這是大數(shù)據(jù)時(shí)代背景下我們的終極理想。只是,需要努力的是,我們暫未找到一個(gè)很好的盈利模式,包括走在前面的阿里。
“今天很多大數(shù)據(jù)公司還在投資,我們還看不清他的贏利點(diǎn)到底在哪里,最簡(jiǎn)單的是用數(shù)據(jù)去做一些數(shù)據(jù)產(chǎn)品,比如以前的數(shù)據(jù)魔方,或者今天的阿里金融,就是用數(shù)據(jù)生產(chǎn)一套新的東西出來(lái),我相信這是今天比較容易能看見(jiàn)的?!避?chē)品覺(jué)說(shuō)。
此前,阿里集團(tuán)董事局主席馬云提出了“平臺(tái)、金融、數(shù)據(jù)”三步走的戰(zhàn)略,繼阿里集團(tuán)架構(gòu)調(diào)整、組建小微金融服務(wù)集團(tuán)后,再次傳出阿里金融讓銀行緊張的說(shuō)法。
據(jù)介紹,阿里金融是針對(duì)中小企業(yè)在這個(gè)時(shí)代的融資需求應(yīng)運(yùn)而生,這個(gè)方案貫徹了透明、開(kāi)放、責(zé)任與分享,它的第一職責(zé)不是幫助金融機(jī)構(gòu),幫助客戶(hù)、幫助無(wú)數(shù)淘寶賣(mài)家才是阿里金融的責(zé)任所在。
“金融行業(yè)不緊張,我們的小微企業(yè)就很緊張,所以我覺(jué)得假如阿里巴巴集團(tuán)能夠讓現(xiàn)有金融體系緊張一下,也是互聯(lián)網(wǎng)企業(yè)對(duì)社會(huì)進(jìn)步的重要貢獻(xiàn)?!瘪R云說(shuō)。在他看來(lái),任何一個(gè)領(lǐng)導(dǎo)者對(duì)企業(yè)成功的定義都不是挑戰(zhàn)了誰(shuí),而是創(chuàng)造了誰(shuí),否則終有一天會(huì)倒下。
事實(shí)上,從醞釀到曝光,在不為人知的背后,阿里金融走了很多年,在數(shù)據(jù)安全的基礎(chǔ)上,怎么體現(xiàn)出數(shù)據(jù)的價(jià)值?開(kāi)放似乎也還只是一個(gè)構(gòu)想。
“我們今天所走的路是很新的路,參照系的東西并不多,從國(guó)外的公司來(lái)講,有我們這個(gè)數(shù)據(jù)量的公司也并不多,我們確實(shí)是要小心地一步一步去走這條路,我們都很相信,它會(huì)有非常大的價(jià)值,但是這個(gè)價(jià)值將來(lái)到底怎么體現(xiàn)出來(lái),就要看后來(lái)這條路,我也沒(méi)辦法今天去判斷它絕對(duì)的價(jià)值是怎么產(chǎn)生的,每一個(gè)做數(shù)據(jù)的人肯定都非常相信它的價(jià)值,包括我自己在內(nèi)。”關(guān)于大數(shù)據(jù)的未來(lái),車(chē)品覺(jué)總結(jié)道。
大數(shù)據(jù)的話(huà)題雖然很熱,但真正的腳步離我們還很遠(yuǎn);而阿里大數(shù)據(jù),亦尚在路上。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10