
站在大數(shù)據(jù)時(shí)代的風(fēng)口,一切皆有可能
大數(shù)據(jù)一詞近年炙手可熱,而大數(shù)據(jù)究竟是什么或者能做什么,公眾并不太清楚。當(dāng)描繪大數(shù)據(jù)的時(shí)候,通常聽(tīng)到的會(huì)是除了身份等基本信息之外,每個(gè)人生活中的一切活動(dòng),包括消費(fèi)習(xí)慣、對(duì)話(huà)、社交、移動(dòng)都會(huì)被儲(chǔ)存記錄,并用以分析。這樣的描述有助于增進(jìn)對(duì)大數(shù)據(jù)“怎么來(lái)”的感性理解,卻未能呈現(xiàn)它能“做什么”。隨著互聯(lián)網(wǎng)的發(fā)展和信息數(shù)字化程度的指數(shù)級(jí)增長(zhǎng),這些收集起來(lái)的數(shù)據(jù)集所形成的大數(shù)據(jù),經(jīng)過(guò)分析和應(yīng)用,可以在國(guó)防、公共服務(wù)、醫(yī)療、金融和企業(yè)創(chuàng)新等各行業(yè)各方面提升效率并創(chuàng)造新的可能——— 服務(wù)于當(dāng)下并預(yù)測(cè)甚至規(guī)劃未來(lái)。
有很多令人嘆為觀止的新興領(lǐng)域或解決方案,其實(shí)都是以大數(shù)據(jù)為基礎(chǔ),例如:通過(guò)收集和分析醫(yī)療數(shù)據(jù),研發(fā)新的醫(yī)療技術(shù);通過(guò)對(duì)各類(lèi)數(shù)據(jù)的關(guān)聯(lián)分析,為金融反欺詐提供決策支持;區(qū)塊鏈也是基于大數(shù)據(jù)實(shí)時(shí)分析的產(chǎn)品,建成后可以大幅增進(jìn)信息透明度取代人工,銀行將是成本和道德風(fēng)險(xiǎn)降低的受益者;美國(guó)本月剛宣布要建立全國(guó)武力使用數(shù)據(jù)手機(jī)系統(tǒng)來(lái)掌握警方對(duì)平民使用暴力和拘留所死亡事件發(fā)生的頻度,以防止警察濫用暴力。包括最近很受關(guān)注的人工智能(AI)在內(nèi),都和大數(shù)據(jù)緊密相關(guān)。
從2012年美國(guó)啟動(dòng)“大數(shù)據(jù)研究和發(fā)展”計(jì)劃以來(lái),英國(guó)、澳大利亞、日本、韓國(guó)等多個(gè)國(guó)家亦推出了一系列積極擁抱大數(shù)據(jù)的政策。當(dāng)然,美國(guó)依然是這場(chǎng)信息革命的領(lǐng)頭羊,無(wú)論在數(shù)據(jù)源或分析工具、可視化呈現(xiàn)、決策支持方面,美國(guó)都最為成功。估值最高的大數(shù)據(jù)領(lǐng)域企業(yè)Palantir,最突出的案例是幫助美國(guó)政府獵殺本·拉丹;Ayasdi專(zhuān)注于醫(yī)療數(shù)據(jù)分析和人工智能,和多個(gè)頂級(jí)美國(guó)醫(yī)院、藥廠都有合作;Tab-leau和DO M O都是數(shù)據(jù)可視化方面的佼佼者;而在美國(guó)總統(tǒng)大選中因預(yù)測(cè)而備受關(guān)注的FiveThirtyEight,則是針對(duì)政治、文化、體育運(yùn)動(dòng)和經(jīng)濟(jì)熱點(diǎn)進(jìn)行大數(shù)據(jù)分析的博客。
中國(guó)也在加快進(jìn)入大數(shù)據(jù)時(shí)代的步伐,近期剛提出建設(shè)國(guó)家新型城鎮(zhèn)化大數(shù)據(jù)庫(kù)。在此時(shí)啟動(dòng)大數(shù)據(jù)綜合試驗(yàn)區(qū),是十分有價(jià)值且有預(yù)見(jiàn)性的嘗試,廣東亦有一定的技術(shù)支持和開(kāi)放環(huán)境。
不過(guò),在大數(shù)據(jù)領(lǐng)域,我國(guó)還處于入門(mén)階段,基礎(chǔ)比較薄弱。首先,最大的問(wèn)題是數(shù)據(jù)源缺乏。政府是最大的數(shù)據(jù)收集者和使用者,所以各國(guó)的大數(shù)據(jù)政策中,政府?dāng)?shù)據(jù)開(kāi)放都是第一步。而我國(guó)的政府?dāng)?shù)據(jù)在收集方式及儲(chǔ)存方式上都還很傳統(tǒng),醫(yī)保、社保及住房信息尚未全國(guó)聯(lián)網(wǎng),政府預(yù)算和決算等財(cái)務(wù)信息也比較粗糙,數(shù)據(jù)源本身的質(zhì)量和數(shù)量都有缺漏。企業(yè)所擁有的數(shù)據(jù)就更零碎,主要集中在BAT,如阿里的淘寶和支付寶,騰訊的微信和Q Q,百度的搜索引擎,而即便BA T都尚未能對(duì)大數(shù)據(jù)進(jìn)行深入分析使用。私人部門(mén)擁有的數(shù)據(jù)都很零碎,因此,很多大熱產(chǎn)品實(shí)質(zhì)上都是假借大數(shù)據(jù)之名進(jìn)行關(guān)聯(lián)推送等淺層使用,只是通過(guò)刷用戶(hù)活躍度和講故事來(lái)圈錢(qián)。
大數(shù)據(jù)的應(yīng)用,數(shù)據(jù)源、分析方法和科研支持,缺一不可。這需要從政府到企業(yè)、從高校到非營(yíng)利部門(mén)的全方位支持。無(wú)論是數(shù)據(jù)的挖掘、數(shù)據(jù)分析和使用、數(shù)據(jù)可視化,中國(guó)都才剛到門(mén)邊,對(duì)于利用大數(shù)據(jù)提升公共服務(wù)質(zhì)量、執(zhí)政透明度、開(kāi)發(fā)新醫(yī)療技術(shù)或者探討大數(shù)據(jù)使用和隱私保護(hù)的邊界,就更是門(mén)外漢。但不要緊,全世界的大數(shù)據(jù)應(yīng)用也不過(guò)才開(kāi)始幾年而已。大數(shù)據(jù)綜合試驗(yàn)區(qū)是令人欣喜的嘗試,除了一腔熱情與政策優(yōu)惠,更需要技術(shù)積累與科研支持。廣東既然先邁出了這一步,可以從開(kāi)放數(shù)據(jù)做起,加大科研力度,放開(kāi)戶(hù)籍政策吸引人才,并以政府購(gòu)買(mǎi)服務(wù)等方式激勵(lì)第三方企業(yè)的技術(shù)創(chuàng)新。站在大數(shù)據(jù)時(shí)代的風(fēng)口,一切才剛開(kāi)始,一切皆有可能。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書(shū)) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07