
我們只有先度過把數(shù)據(jù)當(dāng)成權(quán)力使用的腐敗時代,向著數(shù)據(jù)分享的時代邁進(jìn),才能看到激動人心的大數(shù)據(jù)時代的來臨。總之,心里多多少少對我們這一代人抱著這么一點(diǎn)點(diǎn)希望,大家一起開心地“玩”吧!
牛津大學(xué)教授維克托·邁爾·舍恩伯格所著的《大數(shù)據(jù)時代:生活、工作、思維的大變革》一書,被認(rèn)為是大數(shù)據(jù)時代到來的先河之作。大數(shù)據(jù)涉及最多的為計算機(jī)、生物學(xué)、生態(tài)學(xué)、經(jīng)濟(jì)學(xué)、地理學(xué)、天文物理和公共衛(wèi)生等領(lǐng)域,應(yīng)用較多的方向?yàn)榫W(wǎng)絡(luò)分析、交通系統(tǒng)、犯罪區(qū)域、人權(quán)、動植物保護(hù)以及傳染性疾病和感冒預(yù)測等。
全球一部分領(lǐng)先者已經(jīng)開始思考大數(shù)據(jù)分析技能和計算水平的提升。大數(shù)據(jù)時代的來臨源于不同領(lǐng)域、不同部門的合作和數(shù)據(jù)分享,可以說是數(shù)據(jù)分享的更高層次。但是不得不承認(rèn)的一個現(xiàn)象是,國內(nèi)許多領(lǐng)域卻在糾結(jié)于數(shù)據(jù)分享,以及數(shù)據(jù)腐敗斗爭的事實(shí)。
什么是數(shù)據(jù)?在我看來就是所有可以進(jìn)一步分析和推理用的知識點(diǎn)。逐年累月的記錄、基礎(chǔ)數(shù)據(jù)、加工過的數(shù)據(jù)都可以作為數(shù)據(jù)分析中的數(shù)據(jù)。所謂數(shù)據(jù)分享,打個比方,就像幼兒園小朋友交換玩具,如果你不自愿交換就沒人和你玩,那你就得自己玩,雖然你可能會說自己玩也挺好,但就是要注定孤獨(dú)終老?!耙黄鹜妗边@個動作延伸到科研領(lǐng)域其實(shí)就是一種合作—大家一起“玩”一堆數(shù)據(jù),一起“玩”出一些有趣的結(jié)果。但是交換玩具這個在幼兒園里簡單的游戲被放到成人的世界就變得異常復(fù)雜。數(shù)據(jù)在成人手中變成了一種稀缺資源和一種權(quán)力之后,基本上游戲規(guī)則就變成了“我要看得起你我才和你分享,或者你給我什么好處我才給你分享”,而在國內(nèi)大體上就是這樣的情況。
那么,在科研中我們?yōu)槭裁匆窒頂?shù)據(jù)?—當(dāng)然就是為了更好地合作,為了做出更好的工作?!胺窒怼边@個動作基本上是出于互相信任,并且對結(jié)果有所期待的情況下發(fā)生的。我們都常常期待著與比你厲害的人,或者懂你的人,分享并得出更好的、更有用的結(jié)果。
那么,為什么我們又不能互相分享數(shù)據(jù)呢?我認(rèn)為這其中涉及三個層面的問題。
出于國家安全的考慮
數(shù)據(jù)分享或者說“泄密”過程中可能損害某些群體的利益。具體不再詳述,因?yàn)槊總€國家、每個地區(qū)對國家安全的定義不一樣。比如,貧困人口比率和饑餓在非洲各國是敏感數(shù)據(jù),在其他國家多少可能都是,只是機(jī)密級別不一樣?!鞍踩边@個詞本來也很難界定邊界,而且和國際環(huán)境、國家利益、財團(tuán)利益結(jié)合在一起時,就太模糊。
前幾天看美國喬恩·斯圖爾特的每日秀,最近邀請的是當(dāng)時斯諾登逃離美國時,在我國香港約見的第一位記者。喬恩問那位記者,你認(rèn)為斯諾登這樣泄密幼稚嗎?記者回答:“他有一點(diǎn)理想主義,認(rèn)為盡管自己泄露了機(jī)密還是愿意相信國家公正的司法系統(tǒng)?!绷硪粋€例子是維基解密,它使得很多國家和政府的機(jī)密數(shù)據(jù)被曝光。不管出發(fā)點(diǎn)怎樣,最后的泄密者基本上要么背井離鄉(xiāng)逃亡,要么淪為階下之徒。所有涉密或者事關(guān)國家安全的數(shù)據(jù)都是“分享者”的禁區(qū)。
技術(shù)安全與分享
記得我當(dāng)時和一位老師討要衛(wèi)星影像(他后來給了我數(shù)據(jù)),他和我提到“國家安全”和“技術(shù)安全”這兩個詞。這里說的技術(shù)安全其實(shí)是—要是我給了你數(shù)據(jù),你做出比我更出色的工作怎么辦?作為科研人,每個人多少都會問自己這樣的問題。我們到底要不要和其他人分享自己的數(shù)據(jù)?到底是怕別人超過自己,還是因?yàn)楂@取數(shù)據(jù)的成本太大你輸不起?還是你認(rèn)真分析所有的利弊之后作出的決定?
如果僅僅出于“害怕別人做出比自己更出色的工作”的心態(tài),科研的前途就令人擔(dān)憂。這里面涉及一個長遠(yuǎn)性的問題。長遠(yuǎn)性也有三個層次:眼前利益、中長期利益和長期利益。普通人關(guān)心的柴米油鹽是今天、明天的事情,政策決策者作決定至少要看未來十幾、二十年后的結(jié)果。但科研人員應(yīng)該看到更長遠(yuǎn)的未來。不過,作為每天都要“吃穿用度”的科研人員,我們很容易犯短視的毛病。
在我碰到的各國功成名就的科學(xué)家里,在我看來都是秉承著“你需要這個數(shù)據(jù)你就拿去分析,我們一起看看會有什么有趣的結(jié)果”這樣一種心態(tài)。首先是“我們”,然后“一起”,“我們一起”的情況是給你數(shù)據(jù)的人尊敬你的知識、能力,才會和你討教、切磋。當(dāng)你被人欣賞、尊重和信任時,這種轉(zhuǎn)化成的正能量其實(shí)是十分強(qiáng)大的。
數(shù)據(jù)演化成權(quán)力
這兩者的關(guān)系看似有些千絲萬縷,理不清頭緒。但數(shù)據(jù)其實(shí)是可以轉(zhuǎn)化成一種稀缺資源進(jìn)而演化成為一種權(quán)力的—和國內(nèi)一些地方政府合作你就會深深體會到這一點(diǎn),這不僅僅有我個人的部分經(jīng)歷,也聽到周圍一些人的抱怨。有些所謂“不能分享的數(shù)據(jù)”,其實(shí)真正看了之后,就像對某某聲嘶力竭地嘶吼:“十幾二十年你們就干了這點(diǎn)事?!”“什么?你們竟然連這個數(shù)據(jù)都不知道?”“沒改過的原始數(shù)據(jù)在哪里?”……有些情況理解,我國建立也只有短短幾十年,很多數(shù)據(jù)沒有,也還未測過,但是也不用編吧?很多社會經(jīng)濟(jì)收據(jù)采集其實(shí)—
1.數(shù)據(jù)采集部門的工作可以做得更好;
2.拿的是納稅人的錢工作就應(yīng)該有實(shí)實(shí)在在可以測量業(yè)績的數(shù)據(jù);
3.分享數(shù)據(jù)雖然要承擔(dān)風(fēng)險但是對未來的政府工作開展更有用。
所以總體來說,我們只有先度過把數(shù)據(jù)當(dāng)成權(quán)力使用的腐敗時代,向著數(shù)據(jù)分享的時代邁進(jìn),才能看到激動人心的大數(shù)據(jù)時代的來臨??傊睦锒喽嗌偕賹ξ覀冞@一代人抱著這么一點(diǎn)點(diǎn)希望,大家一起開心地“玩”吧!CDA數(shù)據(jù)分析師培訓(xùn)官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03