
使用大數(shù)據(jù),就像在沙子里淘金
在過去幾年,我們這個(gè)世界上的數(shù)據(jù)的增長(zhǎng)速度,相當(dāng)于之前5年、10年的50倍。
大數(shù)據(jù)為什么在這個(gè)點(diǎn)上爆發(fā)?主要原因是,摩爾定律使得存儲(chǔ)的數(shù)據(jù)量空前擴(kuò)張。與此同時(shí),類似RFID那樣的傳感器技術(shù)也得到了質(zhì)的提升。于是,就出現(xiàn)了這樣的例子——
當(dāng)某著名服飾品牌把RFID的芯片放在衣服上,如果你覺得一件衣服挺好看,拿到試衣間試,試完了卻沒買,芯片依然能記錄下你試穿了多長(zhǎng)時(shí)間。由此,他們就會(huì)去研究,到底是什么問題,讓你沒有選擇他們的產(chǎn)品。至于你試都不試,他們則認(rèn)為這很可能是店鋪陳列擺放的問題?;谟缮鲜鲞@些數(shù)據(jù)收集而產(chǎn)生的質(zhì)量管理和服務(wù)改進(jìn),這家店的銷售額在過去10年里漲了5倍,非??捎^。
另外一個(gè)例子,如今也非常有名了。美國(guó)第二大連鎖百貨TARGET將大數(shù)據(jù)運(yùn)用于營(yíng)銷。某天有一位父親特別生氣,到店里來投訴。他說我的女兒只有14歲,可是你們給她推送母嬰廣告。結(jié)果過了一個(gè)星期,經(jīng)理打電話回訪這個(gè)父親,這位父親表達(dá)了歉意:上次是我態(tài)度不好,我的女兒是懷孕了。事實(shí)就是這樣:如果你總是在淘寶上買生活用品,你們家什么時(shí)候需要買手紙了,馬云可能比你的家人知道得還早。
隨著上面的例子越來越多,有人開始認(rèn)為,我們現(xiàn)在正處在人類歷史上的又一個(gè)節(jié)點(diǎn):機(jī)器的智能有可能在我們這個(gè)時(shí)代超過人的智能。
這種推理是怎么來的呢?
持上述觀點(diǎn)的人認(rèn)為:由于計(jì)算機(jī)的速度會(huì)不斷增加,而人的能力發(fā)展基本上是平行的,所以未來某個(gè)時(shí)間點(diǎn)上,機(jī)器智能極有可能超過人的智能。這時(shí),如果我們善于利用大數(shù)據(jù)的特征,可以達(dá)成兩件事。其一,可以換一種思維方式來看待世界。其二,可以制造更先進(jìn)的機(jī)器智能。
換言之,大數(shù)據(jù)就像在一堆沙子里面淘金。當(dāng)你利用到相較于今日一萬(wàn)倍的數(shù)據(jù)時(shí),量變到質(zhì)變的躍升就很可能產(chǎn)生。從這個(gè)意義上來講,未來所有的公司,都可能是要使用大數(shù)據(jù)的公司。
真正的受益者不會(huì)超過2%
未來世界的機(jī)器是不會(huì)控制人的,但制造智能機(jī)器的人,能通過機(jī)器控制其他人。比方說,經(jīng)常去京東、淘寶買東西,實(shí)際上就是被他們控制; 天天用微信,某種程度上就被騰訊控制。
在大數(shù)據(jù)時(shí)代,很多商業(yè)模式也會(huì)變。比如,過去有一個(gè)“吉利模式”,買一個(gè)刀架送一個(gè)刀片。然后吉利靠消費(fèi)者后期的耗材消費(fèi)掙錢??扇缃?,一個(gè)冰箱品牌做了這么一件事。它內(nèi)置于冰箱的芯片可以獲知你家有多少牛奶、多少雞蛋。當(dāng)這些東西沒了,它就會(huì)通知給你送來。換言之,這個(gè)冰箱除了冷凍功能,還被賦予了“貨架”功能。
未來世界里的大數(shù)據(jù)思維,將細(xì)到每一個(gè)人、每一個(gè)商品、每一筆交易,逐漸影響我們的生活,改變整個(gè)生態(tài)鏈。與此同時(shí),技術(shù)的發(fā)展也不可能人為地停止下來。
但很遺憾的是,在任何一次重大的技術(shù)革命中,一開始受益的都是2%的人。正如蒸汽機(jī)的發(fā)明,第一波受益的,是發(fā)明家、工廠主,這是18世紀(jì)晚期的事。但連英國(guó)維多利亞女王迎來她特別榮耀的時(shí)代,都是19世紀(jì)中期的事了。美國(guó)工業(yè)革命,受益的是愛迪生。如今特斯拉也掙了很多錢,受益的是支持他們的GP摩根以及各種關(guān)聯(lián)制造商。老百姓什么時(shí)候開始受益呢?是不是過兩年,其余98%的人就能受益了呢?不是,可能要經(jīng)過兩代人,半個(gè)世紀(jì)后,才能有98%的人受益。
美國(guó)IT革命,從摩爾定律的發(fā)明到今年正好是51年,很多人還沒有受益。美國(guó)和中國(guó)很幸運(yùn),踏準(zhǔn)了信息革命的節(jié)奏。但在我們的周圍,南美洲、整個(gè)阿拉伯地區(qū)、東歐地區(qū),甚至南歐,對(duì)IT革命的貢獻(xiàn)幾乎為零。我希望大家能看到站在你們后面的這98%的人。你們要關(guān)注這些,更要堅(jiān)守住這2%的位置。
學(xué)習(xí)是一輩子的事
前一陣谷歌的AlphaGo非?;穑谑怯腥藛?,AlphaGo的學(xué)習(xí)速度太驚人了,和以前的學(xué)習(xí)方法相比,未來年輕人的學(xué)習(xí),是否只剩下思維模式上的突破?
后來我一個(gè)同事,他的孩子在學(xué)下棋,他就說那我們?nèi)グ袮lphaGo這個(gè)程序打開,看看它到底怎么下的,讓孩子學(xué)學(xué)。結(jié)果打開一看,發(fā)現(xiàn)根本沒法模仿,里面就是一個(gè)很簡(jiǎn)單的數(shù)學(xué)模型,然后一堆亂七八糟的數(shù)字。所以,機(jī)器產(chǎn)生智能和人產(chǎn)生智慧完全是兩回事。但我想講兩點(diǎn)——
第一,機(jī)器最擅長(zhǎng)的工作還是重復(fù)性。AlphaGo 差不多有50個(gè)左右的版本,有時(shí)候一天就下好幾千盤棋。但人類最重要的一個(gè)能力是創(chuàng)造力。在我們祖先活下來的地方,比如走出非洲那會(huì)兒,除了生存,還有樂器、創(chuàng)造性和想象力。
第二,比學(xué)習(xí)方法、思維模式更重要的,其實(shí)是終身學(xué)習(xí)。學(xué)習(xí)是一輩子的事,這點(diǎn)最重要。我原來周圍有一些人比我的學(xué)業(yè)能力要強(qiáng)一些,但他們一旦拿到博士,就把書本一扔,從此不再學(xué)習(xí),慢慢他們的知識(shí)就老化了。而我雖然不是一個(gè)有很好學(xué)習(xí)方法的人,卻是一個(gè)能夠不斷學(xué)習(xí)的人。
正如你和你的父輩要掌握的技能早已不同,如今,說任何一個(gè)專業(yè)如何好、如何壞都失之簡(jiǎn)單。現(xiàn)在來講,已經(jīng)很難有專業(yè)比人的壽命要短,因此,你要做好在不遠(yuǎn)的未來?yè)Q專業(yè)的準(zhǔn)備。也許你的專業(yè)會(huì)過時(shí),但你利用最先進(jìn)的技術(shù),比如計(jì)算機(jī),來學(xué)習(xí)和提升自己這件事,永遠(yuǎn)不會(huì)過時(shí)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10