
如果要用一句話來說明大數(shù)據(jù)(big data)的價(jià)值,那就是「整體大于部分的總和」。單獨(dú)看來覺得瑣碎平凡的資料,匯總起來經(jīng)過各種演算法的分析,可以展現(xiàn)從資料的任一部分都看不出來的高價(jià)值面貌。
先舉個(gè)不巨量、但發(fā)生在你自己身上的例子:知覺。
在a右圖中,你可以約略看到一個(gè)圓。但是當(dāng)你單獨(dú)檢視那叁個(gè)棕色的區(qū)域,你是看不到圓形的。那個(gè)圓,只在整體的層次可以看到。
再舉個(gè)真正巨量、也發(fā)生在你自己身上的例子:人腦。人腦由一百億個(gè)神經(jīng)元與一百兆個(gè)連結(jié)組成。每個(gè)神經(jīng)元就做一件簡單的事:激發(fā)或不激發(fā)。一百億個(gè)簡單的 0 與 1 狀態(tài)由一百兆個(gè)連結(jié)組織起來,展現(xiàn)出各種復(fù)雜的認(rèn)知與情感能力。這些能力是在個(gè)別神經(jīng)元或連結(jié)上看不到的。
大數(shù)據(jù)的應(yīng)用也展現(xiàn)出同樣的特性。利用現(xiàn)代資訊技術(shù)將單獨(dú)的資料點(diǎn)匯總成為規(guī)模超大的資料庫,再藉由人工智慧演算法的分析,讓人們可以發(fā)現(xiàn)只能在整體層次看到的規(guī)律性、相關(guān)性與改變趨勢。
這樣的預(yù)測力不會(huì)只存在于整體層次。只要透過設(shè)計(jì),還可以回到個(gè)體層次,帶來更能夠滿足人們需求的產(chǎn)品、服務(wù)、環(huán)境與政策,改善使用者經(jīng)驗(yàn),提升人們的生活品質(zhì)。
美中不足之處是分析大數(shù)據(jù)的演算法在還是個(gè)黑箱。我學(xué)過人工智慧,也做過語料庫語言學(xué)與自然語言處理的研究,有些地方大約可以猜測是怎麼分析的。但如果作者能以一兩個(gè)例子解說能夠做到這些了不起的事情的演算法有什麼特性,會(huì)更滿足我的好奇心,也更能促進(jìn)一般讀者的理解。
最后,回到你的身上。如果你能把一生中每分每秒所聽所見所做鉅細(xì)靡遺記錄下來,也是一種大數(shù)據(jù)。你的大腦做不到(記憶瑣碎且無關(guān)聯(lián)的細(xì)節(jié)不是大腦的強(qiáng)項(xiàng)),但科技做得到。以現(xiàn)代的科技來看,儲(chǔ)存空間不是大問題。關(guān)鍵同樣在分析的方式。
七十九歲的微軟研究員Gordon Bell就把他長達(dá)十余年的親身實(shí)驗(yàn)經(jīng)驗(yàn),包括記錄與分析的工具,算是個(gè)人大數(shù)據(jù)的開端。相信再過不久,每個(gè)人都能擁有完整的數(shù)位記憶,而分析這些大數(shù)據(jù)則可以幫助我們更了解自己是一個(gè)什麼樣的人,非??赡鼙任覀冏砸詾榱私獾母鼫?zhǔn)確。
本文轉(zhuǎn)自:中國大數(shù)據(jù)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 Power BI 制作地圖熱力圖:基于經(jīng)緯度數(shù)據(jù)的實(shí)踐指南 在數(shù)據(jù)可視化領(lǐng)域,地圖熱力圖憑借直觀呈現(xiàn)地理數(shù)據(jù)分布密度的優(yōu)勢,成 ...
2025-07-24解析 insert into select 是否會(huì)鎖表:原理、場景與應(yīng)對策略 在數(shù)據(jù)庫操作中,insert into select 是一種常用的批量數(shù)據(jù)插入語句 ...
2025-07-24CDA 數(shù)據(jù)分析師的工作范圍解析 在數(shù)字化時(shí)代的浪潮下,數(shù)據(jù)已成為企業(yè)發(fā)展的核心資產(chǎn)之一。CDA(Certified Data Analyst)數(shù)據(jù)分 ...
2025-07-24從 CDA LEVEL II 考試題型看 Python 數(shù)據(jù)分析要點(diǎn) 在數(shù)據(jù)科學(xué)領(lǐng)域蓬勃發(fā)展的當(dāng)下,CDA(Certified Data Analyst)認(rèn)證成為眾多從 ...
2025-07-23用 Python 開啟數(shù)據(jù)分析之旅:從基礎(chǔ)到實(shí)踐的完整指南 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析已成為各行業(yè)不可或缺的核心能力。而 Pyt ...
2025-07-23鳶尾花判別分析:機(jī)器學(xué)習(xí)中的經(jīng)典實(shí)踐案例 在機(jī)器學(xué)習(xí)的世界里,有一個(gè)經(jīng)典的數(shù)據(jù)集如同引路明燈,為無數(shù)初學(xué)者打開了模式識(shí)別 ...
2025-07-23解析 response.text 與 response.content 的核心區(qū)別 在網(wǎng)絡(luò)數(shù)據(jù)請求與處理的場景中,開發(fā)者經(jīng)常需要從服務(wù)器返回的響應(yīng)中提取數(shù) ...
2025-07-22解析神經(jīng)網(wǎng)絡(luò)中 Softmax 函數(shù)的核心作用 在神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程中,激活函數(shù)扮演著至關(guān)重要的角色,它們?yōu)榫W(wǎng)絡(luò)賦予了非線性能力, ...
2025-07-22CDA數(shù)據(jù)分析師證書考取全攻略 一、了解 CDA 數(shù)據(jù)分析師認(rèn)證 CDA 數(shù)據(jù)分析師認(rèn)證是一套科學(xué)化、專業(yè)化、國際化的人才考核標(biāo)準(zhǔn), ...
2025-07-22左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 在統(tǒng)計(jì)分析、數(shù)據(jù)建模和科學(xué)研究中,正態(tài)分 ...
2025-07-22你是不是也經(jīng)常刷到別人漲粉百萬、帶貨千萬,心里癢癢的,想著“我也試試”,結(jié)果三個(gè)月過去,粉絲不到1000,播放量慘不忍睹? ...
2025-07-21我是陳輝,一個(gè)創(chuàng)業(yè)十多年的企業(yè)主,前半段人生和“文字”緊緊綁在一起。從廣告公司文案到品牌策劃,再到自己開策劃機(jī)構(gòu),我靠 ...
2025-07-21CDA 數(shù)據(jù)分析師的職業(yè)生涯規(guī)劃:從入門到卓越的成長之路 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的當(dāng)下,數(shù)據(jù)已成為企業(yè)核心競爭力的重要來源,而 CD ...
2025-07-21MySQL執(zhí)行計(jì)劃中rows的計(jì)算邏輯:從原理到實(shí)踐 MySQL 執(zhí)行計(jì)劃中 rows 的計(jì)算邏輯:從原理到實(shí)踐 在 MySQL 數(shù)據(jù)庫的查詢優(yōu)化中 ...
2025-07-21在AI滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數(shù)據(jù)之戰(zhàn),CDA認(rèn)證已成為決定企業(yè)存續(xù)的生死線!據(jù)麥肯錫全球研究院數(shù)據(jù)顯示,AI驅(qū) ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無望、技能過時(shí)……當(dāng)職場中年危機(jī)與數(shù)字化浪潮正面交鋒,你是否發(fā)現(xiàn): 簡歷投了10 ...
2025-07-20CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘龌蚴窃诼殘稣媾R崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競爭力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18