
“大數(shù)據(jù)”時(shí)代的數(shù)字淘寶_數(shù)據(jù)分析師
“如果能觀(guān)察的更細(xì)致,我們能做到的就更多?!倍兰o(jì)生物科學(xué)、材料科學(xué)和制藥技術(shù)之所以能有革命性發(fā)展,非常關(guān)鍵的原因之一是三十年代電子顯微鏡的問(wèn)世。而互聯(lián)網(wǎng)的逐漸成熟,正在使得洞察經(jīng)濟(jì)社會(huì)的細(xì)微變化成為可能。大數(shù)據(jù)的應(yīng)用或許可以比作社會(huì)科學(xué)領(lǐng)域的電子顯微鏡。
或許是正應(yīng)了英雄所見(jiàn)略同這句古話(huà),最新一期的《哈佛商業(yè)評(píng)論》和《MIT斯隆管理評(píng)論》都分別以“大數(shù)據(jù)”作為主題。眾多學(xué)者和企業(yè)加入對(duì)大數(shù)據(jù)時(shí)代的預(yù)測(cè)和探討,他們得出的結(jié)論是:在未來(lái),數(shù)據(jù)將會(huì)像土地、石油和資本一樣,成為經(jīng)濟(jì)運(yùn)行中的根本性資源。
有人估算,數(shù)據(jù)正在以每年超過(guò)50%的速度增長(zhǎng)。這意味著每二十個(gè)月左右的時(shí)間,世界上的數(shù)據(jù)就會(huì)翻一番。真不可思議!不過(guò)想想超市柜臺(tái)的掃描儀和商場(chǎng)的POS機(jī),想想淘寶、攜程、大眾點(diǎn)評(píng),想想微博、谷歌[微博]、Facebook……你會(huì)也許會(huì)相信,數(shù)據(jù)的真是積累速度可能還要更快。
“物聯(lián)網(wǎng)”已不再是一個(gè)概念,而是正在形成一個(gè)實(shí)體的、有經(jīng)濟(jì)價(jià)值的豐滿(mǎn)的網(wǎng)絡(luò),像“互聯(lián)網(wǎng)”一樣。伴隨著電子商務(wù)、網(wǎng)上社交平臺(tái)、網(wǎng)絡(luò)媒體的發(fā)展,數(shù)據(jù)像資本一樣在互聯(lián)網(wǎng)上迅速積累;與此同時(shí),超市、交通運(yùn)輸、傳媒等傳統(tǒng)行業(yè)中的數(shù)據(jù)也將有可能被得到更有效的開(kāi)發(fā)和利用。
淘寶的數(shù)字“淘寶”
互聯(lián)網(wǎng)中的數(shù)據(jù)就像埋藏在地下的礦石,品味是不一樣的。其中最有價(jià)值、最方便使用的數(shù)據(jù)當(dāng)然是直接產(chǎn)生于交易活動(dòng)的數(shù)據(jù)。
以“淘寶”為例,每天有數(shù)以萬(wàn)計(jì)的交易在淘寶上進(jìn)行。與此同時(shí)相應(yīng)的交易時(shí)間、商品價(jià)格、購(gòu)買(mǎi)數(shù)量會(huì)被記錄,更重要的是,這些信息可以并與買(mǎi)方和賣(mài)方的年齡、性別、地址、甚至興趣愛(ài)好等個(gè)人特征信息相匹配。運(yùn)用匹配的數(shù)據(jù),淘寶可以進(jìn)行更優(yōu)化的店鋪排名和用戶(hù)推薦;商家可以根據(jù)以往的銷(xiāo)售信息和“淘寶指數(shù)”進(jìn)行生產(chǎn)、庫(kù)存決策,賺更多的錢(qián);而與此同時(shí),更多的消費(fèi)者“親”們也能以更優(yōu)惠的價(jià)格買(mǎi)到更心儀的寶貝。
二十年前,各大中小城市的百貨大樓做不到這一點(diǎn);十年前,大大小小的超市和7-11做不到這一點(diǎn);而互聯(lián)網(wǎng)時(shí)代的淘寶可以。
在今年九月初舉辦的“第九屆全國(guó)網(wǎng)商大會(huì)”上,馬云[微博]提出了阿里巴巴[微博]的“三步戰(zhàn)略”:平臺(tái)、金融、數(shù)據(jù)。提到阿里巴巴發(fā)展的第三個(gè)階段時(shí),馬云暢想到“希望大量的數(shù)據(jù)為國(guó)家做出一個(gè)氣象預(yù)報(bào)臺(tái)”。他說(shuō),這相當(dāng)于是給每家企業(yè)裝上了一個(gè)GPS、一個(gè)雷達(dá)。
事實(shí)上,淘寶早在2011年就已經(jīng)推出了“淘寶指數(shù)”。其趣味幽默的宣傳短片“淘寶知道”更是一度被關(guān)注和熱議。在不遠(yuǎn)的未來(lái),像淘寶這樣的企業(yè)或許真的可以在一定程度部分取代統(tǒng)計(jì)局和價(jià)格監(jiān)測(cè)機(jī)構(gòu)的功能,發(fā)布行業(yè)和宏觀(guān)經(jīng)濟(jì)的景氣指標(biāo)。
所有的企業(yè)都可以在大數(shù)據(jù)中淘寶
但如果你以為只有像淘寶這樣的電子商務(wù)企業(yè)才能在大數(shù)據(jù)時(shí)代大顯身手的話(huà),那說(shuō)明你還是沒(méi)能理解大數(shù)據(jù)的本質(zhì)。
在互聯(lián)網(wǎng)數(shù)據(jù)的海洋中,淘寶所擁有的數(shù)據(jù)幾乎可以說(shuō)是九牛一毛。想一想Google和百度[微博],想一想Facebook和人人網(wǎng),想一想Twitter和微博……淘寶的故事遠(yuǎn)不是大數(shù)據(jù)時(shí)代的全部,大數(shù)據(jù)是所有企業(yè)的“淘寶”游戲,大企業(yè)、小企業(yè),電子商務(wù)企業(yè)、非電子商務(wù)企業(yè)。
看過(guò)電影《點(diǎn)球成金》或者其同名小說(shuō)的人可能對(duì)奧克蘭隊(duì)尋找棒球手的方式印象深刻——他們運(yùn)用復(fù)雜的統(tǒng)計(jì)工具來(lái)深度分析比賽進(jìn)程中運(yùn)動(dòng)員的各項(xiàng)指標(biāo),從而計(jì)算出哪位球員的市值被低估了。
美國(guó)一位政治學(xué)教授通過(guò)對(duì)微博或博客上網(wǎng)民言論的動(dòng)態(tài)數(shù)據(jù)分析,成功預(yù)測(cè)了議員和總統(tǒng)選舉的結(jié)果。而且他得出結(jié)論,如果競(jìng)選團(tuán)隊(duì)足夠聰明和有心,還可能借助他的方法通過(guò)更巧妙、更有效的競(jìng)選宣傳以影響選民的態(tài)度。
……
有趣的故事遠(yuǎn)不止這些。只要你閉上眼睛想一想自己平日里在網(wǎng)上的各種行為:網(wǎng)購(gòu)、發(fā)微博、點(diǎn)人人……你就會(huì)很自然地發(fā)現(xiàn),互聯(lián)網(wǎng)承載太多的信息和信號(hào):大眾的情緒、消費(fèi)者的喜好、市場(chǎng)的潮流、不同人群的關(guān)注點(diǎn)等等。這其中當(dāng)然有很多是數(shù)字垃圾,但聰明的人似乎總能從垃圾中找到珍寶。如果你足夠聰明和努力,你就能找到潛在的市場(chǎng)需求,就能像奧克蘭隊(duì)“點(diǎn)球成金”,創(chuàng)造奇跡。
未來(lái)十年里最熱門(mén)的工作
范里安這個(gè)名字對(duì)于大多數(shù)接受過(guò)經(jīng)濟(jì)學(xué)或商科教育的人來(lái)講都不陌生,他撰寫(xiě)的《中級(jí)微觀(guān)經(jīng)濟(jì)學(xué)》很多年來(lái)一直是最流行的經(jīng)濟(jì)學(xué)教科書(shū)。不過(guò),范里安現(xiàn)在還有一個(gè)身份是Google的首席經(jīng)濟(jì)學(xué)家。他斷言,未來(lái)十年內(nèi)最熱門(mén)的工作將會(huì)是“數(shù)據(jù)科學(xué)家”——互聯(lián)網(wǎng)和電子商務(wù)企業(yè)在過(guò)去十年間積累了大量的數(shù)據(jù),現(xiàn)在到了尋找人才利用這些數(shù)據(jù)的時(shí)候了。
究竟什么樣的人才算得上是“數(shù)據(jù)科學(xué)家”呢?范里安坦言,現(xiàn)在還無(wú)法給出一個(gè)定義,因?yàn)檫@個(gè)領(lǐng)域才剛剛興起,作為一個(gè)職業(yè),數(shù)據(jù)科學(xué)家才剛剛開(kāi)始演化。但顯然,數(shù)據(jù)科學(xué)家們面臨的挑戰(zhàn)遠(yuǎn)大于通常意義上的數(shù)據(jù)分析員和統(tǒng)計(jì)師。他可能需要綜合統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、互聯(lián)網(wǎng)、經(jīng)濟(jì)學(xué)、甚至語(yǔ)義學(xué)等綜合背景;他需要從海量看似毫無(wú)意義的文字和數(shù)字荒漠中找到有價(jià)值的信息,并按圖索驥找出珍寶,最終發(fā)覺(jué)珍寶背后的故事,服務(wù)于商業(yè)管理決策。
根據(jù)麥肯錫全球?qū)W院發(fā)布的一份報(bào)告顯示,未來(lái)僅美國(guó)市場(chǎng)就需要14萬(wàn)到19萬(wàn)擁有深度數(shù)據(jù)分析能力的專(zhuān)業(yè)人士。美國(guó)有些大學(xué)已經(jīng)在籌劃建立相關(guān)學(xué)科和學(xué)位項(xiàng)目,為培養(yǎng)未來(lái)數(shù)據(jù)科學(xué)家做準(zhǔn)備。
大數(shù)據(jù)或?qū)⑾破鹨惠喒芾碜兏?/span>
盡管互聯(lián)網(wǎng)作為一項(xiàng)技術(shù)早在上世紀(jì)六十年代就誕生了,但其大眾化和商業(yè)化也就是最近十幾年的事。在僅僅十年的時(shí)間,互聯(lián)網(wǎng)對(duì)于信息傳遞、商業(yè)模式、生活工作方式的影響可謂滄海桑田。有幸見(jiàn)證這些變遷的我們不得不承認(rèn):互聯(lián)網(wǎng)時(shí)代是更容易誕生奇跡的時(shí)代!
而這些僅僅是開(kāi)始。不論是美國(guó)的谷歌還是中國(guó)的淘寶,他們的成功都或多或少讓人感覺(jué)像是創(chuàng)業(yè)家的探險(xiǎn)和嘗試。迄今為止,互聯(lián)網(wǎng)行業(yè)完成了還主要是硬件和基礎(chǔ)設(shè)施的搭建。如果類(lèi)比經(jīng)濟(jì)史的話(huà),這些僅僅是積累原始資本的階段,隨著用戶(hù)的普及、商業(yè)模式的形成、和數(shù)據(jù)的積累,真正的互聯(lián)網(wǎng)經(jīng)濟(jì)時(shí)代才剛剛開(kāi)始。
數(shù)據(jù)是能產(chǎn)生價(jià)值的,因?yàn)閿?shù)據(jù)背后反應(yīng)的是信息。不同的學(xué)派和實(shí)踐者對(duì)于“管理”的本質(zhì)可能有著完全迥異的理解,但所有的人都會(huì)承認(rèn),管理最核心的要素之一就是信息的收集與傳遞。哈佛大學(xué)量化社會(huì)科學(xué)學(xué)院院長(zhǎng)Gary King認(rèn)為,大數(shù)據(jù)將掀起一場(chǎng)管理革命,無(wú)論是企業(yè)界、學(xué)術(shù)界、還是政策界都將受到重大影響。
再傳統(tǒng)的管理理念中,數(shù)據(jù)分析的理念尚未被很多管理者接受。而在互聯(lián)網(wǎng)興起之前,由于真正可用的數(shù)據(jù)極少,“拍腦袋”或許還可以被原諒,不會(huì)對(duì)企業(yè)經(jīng)營(yíng)造成太大的影響。但在大數(shù)據(jù)時(shí)代,不重視數(shù)據(jù)和數(shù)據(jù)分析的企業(yè)是不會(huì)被市場(chǎng)原諒的。
根據(jù)IDC的預(yù)測(cè),未來(lái)五年內(nèi),大數(shù)據(jù)行業(yè)本身將以平均每年46.8%的復(fù)合增長(zhǎng)率高速發(fā)展。除此之外,大數(shù)據(jù)的發(fā)展還將萌生和帶動(dòng)其他一些相關(guān)企業(yè)。大數(shù)據(jù)時(shí)代就在想我們快速走來(lái),你準(zhǔn)備好了嗎?
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線(xiàn)” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11