
傳統(tǒng)領(lǐng)域是大數(shù)據(jù)創(chuàng)業(yè)藍(lán)海
穿著拖鞋,牛仔褲挽著褲腿,手拿老款諾基亞直板手機(jī),9月14日,在城南一家白領(lǐng)穿梭的高檔商務(wù)寫(xiě)字樓,國(guó)內(nèi)大數(shù)據(jù)行業(yè)領(lǐng)軍人物——電子科技大學(xué)“80后”教授周濤走進(jìn)了記者的視線。
“大數(shù)據(jù)時(shí)代已經(jīng)來(lái)到我們身邊,并沒(méi)有那么多的云遮霧繞,而是相當(dāng)接地氣。”短短一個(gè)小時(shí),周濤用身邊的例子和最直白的表述,撥開(kāi)大數(shù)據(jù)的神秘面紗,描述了一個(gè)可觸摸的數(shù)字化時(shí)代。
專(zhuān)家簡(jiǎn)介
周濤,1982年4月出生于成都。2005年獲中國(guó)科學(xué)技術(shù)大學(xué)學(xué)士學(xué)位,2010年獲瑞士弗里堡大學(xué)物理系哲學(xué)博士學(xué)位?,F(xiàn)任電子科技大學(xué)大數(shù)據(jù)研究中心主任,從事數(shù)據(jù)挖掘與復(fù)雜性科學(xué)研究。
26歲獲教育部自然科學(xué)一等獎(jiǎng),27歲獲聘電子科技大學(xué)正教授,29歲獲中國(guó)青年科技獎(jiǎng),32歲入選Elsevier最具國(guó)際影響力中國(guó)科學(xué)家,33歲擔(dān)任全國(guó)青聯(lián)常委,科技界別副主任。
目前論文引用過(guò)萬(wàn)次,創(chuàng)立、聯(lián)合創(chuàng)立和投資的大數(shù)據(jù)企業(yè)市值過(guò)百億。
怎樣理解大數(shù)據(jù)?
“一切都被記錄,一切都被數(shù)字化。”
從硅谷到成都,大數(shù)據(jù),這個(gè)新鮮的話題正全球同步熱傳。一場(chǎng)關(guān)乎每個(gè)人生活、工作和思維的大變革正在悄然發(fā)生。
到底什么是大數(shù)據(jù)?
周濤認(rèn)為,“大數(shù)據(jù)”是“數(shù)據(jù)化”趨勢(shì)下的必然產(chǎn)物。數(shù)據(jù)化的核心理念是:一切都被記錄,一切都被數(shù)字化?!白罱鼉赡辏瑪?shù)據(jù)量爆炸性劇增,幾乎等同于2010年以前整個(gè)人類(lèi)文明產(chǎn)生的數(shù)據(jù)量總和?!?/span>
瀏覽過(guò)的網(wǎng)頁(yè)、去過(guò)的地方、吃過(guò)的東西、購(gòu)買(mǎi)過(guò)的產(chǎn)品……不經(jīng)意間,我們生活中的很多數(shù)據(jù)已經(jīng)被記錄。
這么多數(shù)據(jù),有什么用?
周濤解釋?zhuān)骸按髷?shù)據(jù)要求數(shù)據(jù)能充分發(fā)揮其外部性,并通過(guò)與某些相關(guān)數(shù)據(jù)交叉融合,產(chǎn)生遠(yuǎn)大于簡(jiǎn)單加和的巨大價(jià)值?!北热?,國(guó)家電網(wǎng)智能電表的數(shù)據(jù)可以用于估計(jì)房屋空置率,淘寶銷(xiāo)售數(shù)據(jù)可以用來(lái)判斷經(jīng)濟(jì)走勢(shì),微博上的關(guān)注關(guān)系和內(nèi)容信息可以用于購(gòu)物推薦和廣告推送……
最近,周濤和他的團(tuán)隊(duì)正在做一件有意思的事情——尋找校園中最孤獨(dú)的人。他們通過(guò)選課記錄、食堂用餐刷卡等,從電子科大3萬(wàn)名在校生中,采集到了2億多條學(xué)生行為數(shù)據(jù)。通過(guò)對(duì)不同ID卡“一前一后刷卡”的記錄進(jìn)行分析,可以發(fā)現(xiàn)一個(gè)學(xué)生在學(xué)校有多少親密的朋友,比如戀人、閨蜜、死黨?!拔覀儗ふ业搅?00多個(gè)最孤獨(dú)的人。他們平均在校兩年半時(shí)間,一個(gè)死黨都沒(méi)有,這是一件很可怕的事情?!敝軡治觯瑪?shù)據(jù)表現(xiàn)出這些學(xué)生存在一定的社交障礙,這些人中17%的人可能產(chǎn)生心理疾病。由此,學(xué)校可以對(duì)這些學(xué)生更加關(guān)注,有針對(duì)性地幫助他們解決心理問(wèn)題。
這項(xiàng)針對(duì)在校大學(xué)生行為的大數(shù)據(jù)研究,是教育部網(wǎng)絡(luò)文化建設(shè)示范性項(xiàng)目中的亮點(diǎn)。在周濤看來(lái),這樣的行為數(shù)據(jù)研究還有廣闊的應(yīng)用市場(chǎng),比如可以移植到高強(qiáng)度的勞動(dòng)密集型行業(yè)中,關(guān)注廣大產(chǎn)業(yè)工人的心理疾病問(wèn)題。
如何利用好大數(shù)據(jù)?
“跨領(lǐng)域關(guān)聯(lián),才是大數(shù)據(jù)的精髓。”
近期,成都市設(shè)立全國(guó)第三個(gè)大數(shù)據(jù)管理局的消息,又一次提振了成都大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的信心。“推動(dòng)新興產(chǎn)業(yè)發(fā)展,成都再一次走在了全國(guó)前列?!痹谥軡磥?lái),大數(shù)據(jù)管理首先帶來(lái)的改變,就是將實(shí)現(xiàn)全市政務(wù)數(shù)據(jù)的共融共通。目前,各部門(mén)都儲(chǔ)備了大量既權(quán)威又高價(jià)值的數(shù)據(jù),但卻很難實(shí)現(xiàn)部門(mén)間的數(shù)據(jù)共享?,F(xiàn)在通過(guò)大數(shù)據(jù)管理局的牽頭,就能實(shí)現(xiàn)政府部門(mén)權(quán)威數(shù)據(jù)的高效管理和資源共享。
借助大數(shù)據(jù),企業(yè)和政府管理人員的決策,也將從“經(jīng)驗(yàn)即決策”過(guò)渡到“數(shù)據(jù)輔助決策”,最后實(shí)現(xiàn)“數(shù)據(jù)即決策”;教育培訓(xùn)、零售業(yè)和醫(yī)療服務(wù)等行業(yè),也有望實(shí)現(xiàn)對(duì)服務(wù)對(duì)象的數(shù)字化和個(gè)性化定量服務(wù)?!胺指畹臄?shù)據(jù)價(jià)值有限,只有實(shí)現(xiàn)數(shù)據(jù)的流動(dòng)才能最大化數(shù)據(jù)價(jià)值?!敝軡J(rèn)為,這個(gè)觀點(diǎn)也同樣適用于當(dāng)前電子商務(wù)的發(fā)展?!皵?shù)據(jù)的關(guān)聯(lián)形態(tài)正在發(fā)生變化,一名用戶(hù)既在微信上,也在微博上,同時(shí)還有線下醫(yī)保、社保等數(shù)據(jù),以及交通出行數(shù)據(jù)。要了解一名用戶(hù),這些數(shù)據(jù)都需要關(guān)聯(lián)起來(lái)進(jìn)行處理。”
周濤提出,大數(shù)據(jù)的本質(zhì)不在于數(shù)據(jù)量有多少,也不在于是否是異構(gòu)的數(shù)據(jù),而是在于數(shù)據(jù)是關(guān)聯(lián)的,整體的數(shù)據(jù)可以流動(dòng)起來(lái)。“跨領(lǐng)域關(guān)聯(lián),通過(guò)一加一產(chǎn)生遠(yuǎn)大于二的價(jià)值,才是大數(shù)據(jù)的精髓?!?/span>
大數(shù)據(jù)時(shí)代如何看待隱私問(wèn)題?
政府和業(yè)界都要擔(dān)責(zé)
每一次敲擊鍵盤(pán),每一次點(diǎn)擊鼠標(biāo),每一次網(wǎng)上交易……在周濤的視野中,互聯(lián)網(wǎng)生活中每一個(gè)習(xí)以為常的輸入,都可能成為大數(shù)據(jù)企業(yè)的“原材料”。企業(yè)就可以利用其中的信息,分析消費(fèi)者的行為,從而為消費(fèi)者提供個(gè)性化、量身定做的服務(wù)。但不可避免的,這也會(huì)帶來(lái)個(gè)人權(quán)利與自由遭到侵犯的隱憂。
實(shí)際上,自從有了互聯(lián)網(wǎng),保護(hù)隱私就成為一個(gè)問(wèn)題,但是以前泄露的方式和途徑比較零散,而大數(shù)據(jù)的技術(shù)和理念,使得企業(yè)和政府有可能以前所未有的力度掌握我們個(gè)人的信息,拼出一個(gè)人的全景信息?!按髷?shù)據(jù)背景下,普通人基本沒(méi)有能力去保護(hù)自己的個(gè)人隱私?!痹谥軡磥?lái),科學(xué)和商業(yè)進(jìn)步,都會(huì)是一把“雙刃劍”,數(shù)字化生活中的隱私保護(hù),個(gè)人的應(yīng)對(duì)能力會(huì)顯得渺小。“要真正融入大數(shù)據(jù)時(shí)代,享受個(gè)性化專(zhuān)屬信息服務(wù),就不得不犧牲一部分個(gè)人隱私。”周濤直言不諱,“付出巨大努力,放棄很多有意義的服務(wù),嘗試保護(hù)自己,往往是得不償失?!?/span>
當(dāng)然,政府和業(yè)界需要扛起擔(dān)子,肩負(fù)起保護(hù)隱私的責(zé)任。周濤表示,政府應(yīng)當(dāng)設(shè)計(jì)出非??量虈?yán)格的法律條例和行業(yè)規(guī)則,這對(duì)大數(shù)據(jù)產(chǎn)業(yè)本身也是一種保護(hù)。針對(duì)那些非法利用個(gè)人隱私來(lái)收獲不正當(dāng)利益的企業(yè),“職能部門(mén)必須下重手,要一棒打死。”
對(duì)能夠處理隱私數(shù)據(jù)的企業(yè),周濤建議必須盡快制定出準(zhǔn)入機(jī)制?!拔覀儸F(xiàn)在正討論一個(gè)方案,對(duì)隱私分等級(jí)?!逼髽I(yè)如果需要處理某一個(gè)層級(jí)個(gè)人隱私數(shù)據(jù),就必須要具備苛刻的準(zhǔn)入資質(zhì),如企業(yè)的軟件防火墻、硬件防火墻需要通過(guò)安全評(píng)測(cè)中心的評(píng)測(cè),確保不被攻破而造成隱私數(shù)據(jù)的泄露。
大數(shù)據(jù)企業(yè)如何創(chuàng)業(yè)?
“從市場(chǎng)痛點(diǎn)入手,做一把殺牛的好刀?!?/span>
“80后”最年輕教授、電子科大博導(dǎo)、最具國(guó)際影響力科學(xué)家……走出一連串學(xué)術(shù)光環(huán),周濤還是創(chuàng)業(yè)場(chǎng)上的實(shí)戰(zhàn)派。
2009年聯(lián)合創(chuàng)立的大數(shù)據(jù)科技公司,目前市值超過(guò)30億元;2013年他出資1.2萬(wàn)元參與創(chuàng)立的一家注冊(cè)資本僅3萬(wàn)元的公司,當(dāng)下個(gè)人所持股份市值已超過(guò)3億元。目前,周濤創(chuàng)立、聯(lián)合創(chuàng)立和投資的20余家大數(shù)據(jù)企業(yè),市值總和超過(guò)百億。“創(chuàng)業(yè)的風(fēng)險(xiǎn)比較高,但也是一件令人興奮的事情。”周濤認(rèn)為,大數(shù)據(jù)創(chuàng)業(yè),需要集中精力做好五方面功課:找準(zhǔn)市場(chǎng)的痛點(diǎn)、具備有優(yōu)勢(shì)門(mén)檻的核心技術(shù)、組建一支專(zhuān)業(yè)管理團(tuán)隊(duì)、找到優(yōu)質(zhì)的數(shù)據(jù)合作方、選擇一家懂自己的基金。
周濤認(rèn)為,大數(shù)據(jù)創(chuàng)業(yè)首先需要從市場(chǎng)的痛處著手,找準(zhǔn)市場(chǎng)的核心需求。如果只有技術(shù),并沒(méi)有尋找到匹配的市場(chǎng),手中拿著刀去再找牛,這樣的創(chuàng)業(yè)一般會(huì)失敗。“如果現(xiàn)在大家都等著殺牛,就可以考慮如何去做一把好刀?!?/span>
8月底,周濤在成都參與創(chuàng)始的一家大數(shù)據(jù)科技公司,完成了1億元人民幣B輪融資。借助基金之手,短短兩年時(shí)間,公司規(guī)模從3萬(wàn)元裂變成10億元?!耙欢ㄕ业揭粋€(gè)懂自己的基金?!痹谥軡磥?lái),大數(shù)據(jù)是不能實(shí)現(xiàn)快速盈利的行業(yè),很多創(chuàng)業(yè)公司會(huì)出現(xiàn)長(zhǎng)時(shí)間的虧損局面,“你的投行不應(yīng)在財(cái)報(bào)上有過(guò)多的要求,而是要一直支撐公司把技術(shù)做得更好更棒?!?/span>
成都的大數(shù)據(jù)創(chuàng)業(yè)環(huán)境如何?周濤認(rèn)為,從全國(guó)范圍比較來(lái)看,成都目前具備很好的大數(shù)據(jù)創(chuàng)業(yè)氛圍,已有多家有業(yè)界影響的公司聚集。但比起北京、上海、杭州、深圳等地區(qū),成都還有一定差距,主要表現(xiàn)在專(zhuān)業(yè)的頂級(jí)投資機(jī)構(gòu)少,頂尖的技術(shù)、運(yùn)營(yíng)、市場(chǎng)和金融人才缺乏兩個(gè)方面。
目前,國(guó)內(nèi)大數(shù)據(jù)的發(fā)展多集中在泡沫較多的垂直應(yīng)用領(lǐng)域,周濤認(rèn)為,大數(shù)據(jù)未來(lái)創(chuàng)業(yè)的藍(lán)海,應(yīng)該集中在目前較少關(guān)注的傳統(tǒng)領(lǐng)域,如醫(yī)療衛(wèi)生、食品安全、工業(yè)制造、農(nóng)業(yè)養(yǎng)殖等領(lǐng)域,創(chuàng)業(yè)者可以更多地關(guān)注具有顛覆性的硬技術(shù)創(chuàng)新,以及大數(shù)據(jù)在傳統(tǒng)行業(yè)的巨大價(jià)值。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10