
你不知道的大數(shù)據(jù)利益鏈背后的秘_數(shù)據(jù)分析師
“數(shù)據(jù)就像是一個(gè)神奇的鉆石礦,在其首要價(jià)值被發(fā)掘之后仍能不斷產(chǎn)生價(jià)值?!痹诰S克托看來(lái),數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。
大數(shù)據(jù)能創(chuàng)造切實(shí)的真金白銀
國(guó)內(nèi)外很多科技公司都試圖潛入冰山底部,將技術(shù)黨手里的數(shù)據(jù)變成切實(shí)的真金白銀。
“銀行最值錢的是什么?數(shù)據(jù)!阿里巴巴最值錢的是什么?數(shù)據(jù)!騰訊最值錢的是什么?用戶數(shù)據(jù)!都是數(shù)據(jù)?!痹谫F陽(yáng)大數(shù)據(jù)交易所總裁王叁壽看來(lái),如果未來(lái)一邊是“互聯(lián)網(wǎng)+”,另一邊就是“大數(shù)據(jù)+”。
大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟會(huì)長(zhǎng)董力明對(duì)此也表示認(rèn)同,互聯(lián)網(wǎng)和大數(shù)據(jù)將是未來(lái)社會(huì)變革的兩個(gè)非常重要的引擎,幾乎會(huì)變革所有的行業(yè)。大數(shù)據(jù)目前可能只是改變了部分行業(yè),比如電商、通訊業(yè),下一步可能會(huì)改變O2O,改變傳統(tǒng)的餐飲娛樂(lè)行業(yè),將來(lái)工業(yè)、農(nóng)業(yè)、金融投資相關(guān)的行業(yè)都會(huì)被大數(shù)據(jù)改變。
“互聯(lián)網(wǎng)同時(shí)會(huì)產(chǎn)生非常多的數(shù)據(jù),人類社會(huì)的數(shù)據(jù)量是每12個(gè)月到18個(gè)月翻一番,你能夠想象到未來(lái)的數(shù)據(jù)量有多大。誰(shuí)能夠解決這個(gè)巨大的挑戰(zhàn),誰(shuí)就能從中創(chuàng)造出價(jià)值,這也是為什么互聯(lián)網(wǎng)公司、技術(shù)類公司都這么關(guān)注大數(shù)據(jù)、積累大數(shù)據(jù)資產(chǎn)和大數(shù)據(jù)技術(shù)的原因。”董力明向《經(jīng)濟(jì)》記者表示。
大數(shù)據(jù)跟政治、經(jīng)濟(jì)、商業(yè)、文化、生活方方面面都有關(guān)系。每個(gè)人的行蹤都是一種數(shù)據(jù),呼吸是一種數(shù)據(jù),就餐行為、交通習(xí)慣甚至刷一張信用卡都是數(shù)據(jù)。
隨著數(shù)據(jù)樣本越來(lái)越多,大數(shù)據(jù)會(huì)變成一個(gè)更加廣泛的應(yīng)用工具。“每一個(gè)事物、每一個(gè)人將來(lái)都可以用數(shù)據(jù)描述出來(lái)?!敝薪饦?biāo)準(zhǔn)數(shù)據(jù)公司總經(jīng)理郝文嘉向《經(jīng)濟(jì)》記者表示,整個(gè)社會(huì)依靠數(shù)據(jù)而連接,變成數(shù)據(jù)驅(qū)動(dòng)型的國(guó)家,這是必然趨勢(shì)。
在王叁壽看來(lái),這種趨勢(shì)為數(shù)據(jù)企業(yè)創(chuàng)造了巨大的生存空間?!按髷?shù)據(jù)這個(gè)行業(yè)是唯一一個(gè)能彎道超車的行業(yè),因?yàn)槟壳皼](méi)有哪家公司能壟斷數(shù)據(jù)行業(yè),唯獨(dú)大數(shù)據(jù)這個(gè)行業(yè)可以繞過(guò)行業(yè)巨頭?!?/span>
數(shù)據(jù)的價(jià)值需要通過(guò)應(yīng)用才能體現(xiàn)出來(lái)?!拔易羁春脦讉€(gè)領(lǐng)域的數(shù)據(jù),一是金融;二是醫(yī)療大數(shù)據(jù);接下來(lái)是能源大數(shù)據(jù)、交通大數(shù)據(jù)和一些商品、物流大數(shù)據(jù),這些領(lǐng)域的大數(shù)據(jù)是比較容易變現(xiàn)的,有很強(qiáng)的買單能力。”王叁壽說(shuō),整個(gè)大數(shù)據(jù)產(chǎn)業(yè),可以做到一萬(wàn)億、兩萬(wàn)億,甚至三萬(wàn)億這樣的產(chǎn)值。”
中國(guó)通訊協(xié)會(huì)常務(wù)副理事長(zhǎng)張新生也向《經(jīng)濟(jì)》記者表示,未來(lái)在醫(yī)療、工業(yè)、企業(yè)營(yíng)銷、城市建設(shè)等方面,大數(shù)據(jù)都有著很大的應(yīng)用空間。
郝文嘉透露稱,目前把大數(shù)據(jù)應(yīng)用最好的還是金融行業(yè),“金融領(lǐng)域是對(duì)大數(shù)據(jù)領(lǐng)域接受度最高的,可能是因?yàn)殂y行、券商、基金公司對(duì)數(shù)據(jù)的渴求,他們對(duì)數(shù)據(jù)非常敏感,接受度也很高?!?/span>
而在董力明看來(lái),大數(shù)據(jù)對(duì)于行業(yè)的作用往往取決于行業(yè)本身的價(jià)值和體量,“比如說(shuō)電信行業(yè)、金融行業(yè),本身體量就很大,大數(shù)據(jù)給它帶來(lái)的價(jià)值也就很可觀”。
數(shù)據(jù)采集的成本是遞減的
經(jīng)過(guò)了幾年的蟄伏,數(shù)據(jù)公司開始集中浮出水面。記者了解到,目前國(guó)內(nèi)大概有800多家大數(shù)據(jù)公司,形形色色大概分了接近30多個(gè)品種,涵蓋了金融大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、能源大數(shù)據(jù)、交通大數(shù)據(jù)等多個(gè)領(lǐng)域。
“現(xiàn)在成立了很多交易的平臺(tái),中關(guān)村就有,它幫你抓取數(shù)據(jù),自己建個(gè)平臺(tái)做搜索?!睆埿律嘎斗Q,目前建立這種平臺(tái)的技術(shù)已經(jīng)成熟,就看誰(shuí)的方法更具創(chuàng)新性。
除了這些平臺(tái)公司抓取來(lái)的資源,大部分?jǐn)?shù)據(jù)資源都掌握在政府部門、互聯(lián)網(wǎng)企業(yè)、運(yùn)營(yíng)商、金融機(jī)構(gòu)里,例如百度做的是社會(huì)數(shù)據(jù),騰訊做的是社交數(shù)據(jù),阿里巴巴做的是電子商務(wù)。每個(gè)公司掌握的數(shù)據(jù)類型都不太一樣。
在張新生看來(lái),數(shù)據(jù)走向商品要經(jīng)歷固化信息痕跡、提取數(shù)據(jù)價(jià)值、分析挖掘、可視化,最后到應(yīng)用這些流程。
而在目前的大數(shù)據(jù)產(chǎn)業(yè)鏈條上,主要有四個(gè)梯隊(duì):第一梯隊(duì)主要做IT基礎(chǔ)建設(shè),例如IBM、華為、中金;第二梯隊(duì)是做數(shù)據(jù)存儲(chǔ)、軟硬件服務(wù);第三梯隊(duì)做大數(shù)據(jù)應(yīng)用;第四梯隊(duì)做大數(shù)據(jù)交易。
這些梯隊(duì)中,有先來(lái)者,也有后來(lái)者。
“我們研究了那么多年,已經(jīng)到了整合彌補(bǔ)數(shù)據(jù)缺陷階段,其實(shí)從社會(huì)各方面來(lái)說(shuō),業(yè)內(nèi)也有很多人在做這種數(shù)據(jù),大家形成了共識(shí),盡快把這條鏈建立起來(lái)?!焙挛募握f(shuō)。
而在王叁壽看來(lái),現(xiàn)在已經(jīng)到了爬上山頂看太陽(yáng)的階段,“在大數(shù)據(jù)領(lǐng)域,創(chuàng)業(yè)就像爬泰山一樣,前幾年所有做大數(shù)據(jù)的公司都在爬山,這兩年陸陸續(xù)續(xù)地開始有一些大數(shù)據(jù)公司爬到山頂上去了”。
“過(guò)去靠弄點(diǎn)兒數(shù)據(jù)就想去賺錢并不容易。但我們覺(jué)得這個(gè)趨勢(shì)沒(méi)問(wèn)題就一直堅(jiān)持,最開始在2011-2013年一分錢沒(méi)賺,從2014年開始盈利,2015年開始有個(gè)爆發(fā)期,北京銀行現(xiàn)在一個(gè)支行買我的大數(shù)據(jù)終端,一個(gè)終端30萬(wàn)一年?!睋?jù)王叁壽透露,現(xiàn)在有一些數(shù)據(jù)公司已經(jīng)開始賺錢了。
前幾年就開始做數(shù)據(jù)的公司無(wú)疑選擇了一個(gè)非常好的創(chuàng)業(yè)時(shí)間點(diǎn),“現(xiàn)在再去重新匯集數(shù)據(jù)已經(jīng)來(lái)不及了,再過(guò)三五年市場(chǎng)變天了”。在他看來(lái),大數(shù)據(jù)這個(gè)行業(yè)想投機(jī)取巧是不行的,它需要很長(zhǎng)時(shí)間的積累。
王叁壽認(rèn)為,大數(shù)據(jù)公司能做得好要取決于三個(gè)方面:第一,要有很廣泛的合法的數(shù)據(jù)采集渠道;第二,要有非常強(qiáng)的數(shù)據(jù)建模能力;第三,要有設(shè)計(jì)應(yīng)用場(chǎng)景的能力,考慮如何讓一些機(jī)構(gòu)用了數(shù)據(jù)之后可以購(gòu)買更廉價(jià)的機(jī)票。
那么數(shù)據(jù)采集的成本如何?“這個(gè)成本其實(shí)是一次性的成本,你只要把數(shù)據(jù)采集渠道打通了,以后就像水管一樣,每天就往里面流水,流進(jìn)來(lái)流出去,關(guān)鍵建水池和鋪管道這個(gè)過(guò)程是需要時(shí)間的。”王叁壽說(shuō),數(shù)據(jù)采集的成本是遞減的。
大數(shù)據(jù)收益由平臺(tái)和賣方四六分成
在董力明看來(lái),數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)最后還是要實(shí)現(xiàn)數(shù)據(jù)交易,否則就沒(méi)有意義。而在我國(guó),目前僅僅成立了貴陽(yáng)大數(shù)據(jù)交易所一個(gè)平臺(tái),其有望成為數(shù)據(jù)領(lǐng)域的深交所、上交所。
“貴陽(yáng)大數(shù)據(jù)交易所是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過(guò)程中的執(zhí)牛耳者?!蓖跞壅f(shuō),沒(méi)有大數(shù)據(jù)交易所誰(shuí)都沒(méi)有辦法去整合中國(guó)的大數(shù)據(jù)產(chǎn)業(yè),“政府?dāng)?shù)據(jù)公開總要有個(gè)渠道,這個(gè)口子在哪里呢,不是說(shuō)幾個(gè)公司就把它公開了,這是不行的,政府自己直接公開也不行,因?yàn)樾枰銮逑?、脫敏、建模、分析,所以交易所也是政府部門日后公開數(shù)據(jù)的一個(gè)出口。”
由此,大數(shù)據(jù)交易鏈條的三個(gè)方面都已具備:數(shù)據(jù)賣方、平臺(tái)和數(shù)據(jù)買方。據(jù)王叁壽介紹,交易所分得數(shù)據(jù)收益的40%,60%將返給數(shù)據(jù)賣方。
那么當(dāng)大數(shù)據(jù)脫下技術(shù)外衣,它的交易流程是什么樣的,誰(shuí)愿意買,買的又是什么?為此,貴陽(yáng)大數(shù)據(jù)交易所相關(guān)負(fù)責(zé)人也向記者舉了一個(gè)生動(dòng)的例子進(jìn)行說(shuō)明。
“大家好,我是一串?dāng)?shù)據(jù),出生時(shí)被命名‘李麗’,記錄了貴陽(yáng)市民李麗在醫(yī)院就診的歷史信息。今年4月份,我和兄弟姐妹被衛(wèi)生部門送進(jìn)一個(gè)大數(shù)據(jù)交易平臺(tái)。進(jìn)入平臺(tái)之前,衛(wèi)生部門給我們洗了一次澡。據(jù)說(shuō),這叫‘?dāng)?shù)據(jù)脫敏’?!痹诮?jīng)過(guò)數(shù)據(jù)脫敏后,和李麗相關(guān)的私人信息都不見(jiàn)了,數(shù)據(jù)代號(hào)由“李麗”變成“X”,只記錄了一位不知名的44歲的貴陽(yáng)女性的病史。
脫敏成功,該數(shù)據(jù)正式進(jìn)大數(shù)據(jù)交易所了。這個(gè)聽(tīng)起來(lái)“高大上”的交易所,和淘寶一樣,是一個(gè)虛擬的交易平臺(tái)。“剛進(jìn)門,我聽(tīng)見(jiàn)衛(wèi)生部門和平臺(tái)的管理方在商量,談了我到底值多少錢。等他們定完價(jià),我就被標(biāo)上價(jià)格,進(jìn)入平臺(tái)展示窗口,等待買家。最終,貴陽(yáng)市一家制藥公司看中我,價(jià)格也合適,老板把我和數(shù)以百萬(wàn)計(jì)的兄弟姐妹一起打包買走了。具體交易額是多少?保密!收益由平臺(tái)和衛(wèi)生部門四六分成。”
到達(dá)制藥公司后,通過(guò)深度挖掘系統(tǒng),制藥公司有針對(duì)性地推出新藥,最后賣給“李麗”這樣的市民。
數(shù)據(jù)交易流程都與以上例子類似,但是在數(shù)據(jù)來(lái)源、種類、重要程度都不同的情況下,大數(shù)據(jù)如何定價(jià)就成了一個(gè)問(wèn)題。
王叁壽表示,數(shù)據(jù)將進(jìn)行自動(dòng)計(jì)價(jià)連續(xù)交易,交易所將針對(duì)每一個(gè)數(shù)據(jù)品種設(shè)計(jì)自動(dòng)的計(jì)價(jià)公式,數(shù)據(jù)買方可以通過(guò)交易系統(tǒng)查詢每一類數(shù)據(jù)的實(shí)時(shí)價(jià)格?!爱?dāng)數(shù)據(jù)買方應(yīng)約價(jià)等于或高于賣方掛牌價(jià)時(shí),按照交易所自動(dòng)撮合成交,成交價(jià)為買方應(yīng)約價(jià)格;對(duì)于不能自動(dòng)成交的應(yīng)約,賣方可選擇能接受的應(yīng)約與其成交,成交價(jià)為買方應(yīng)約價(jià);因?yàn)閿?shù)據(jù)買方不一定需要全部的數(shù)據(jù)樣本,這個(gè)時(shí)候,我們系統(tǒng)將對(duì)數(shù)據(jù)設(shè)定拆分原則,系統(tǒng)自動(dòng)報(bào)價(jià),而后自動(dòng)撮合成功成交。”
并不是所有人都可以在平臺(tái)上購(gòu)買這些大數(shù)據(jù)。記者了解到,交易所對(duì)數(shù)據(jù)買方也進(jìn)行了一些限制,暫時(shí)不允許任何個(gè)人購(gòu)買交易所的數(shù)據(jù)。同時(shí)在監(jiān)管不健全的情況下,外資數(shù)據(jù)買方購(gòu)買數(shù)據(jù)之前需要進(jìn)行資格審查。從這個(gè)角度來(lái)說(shuō),也在一定程度上保證了數(shù)據(jù)的流向。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10