
警惕“大數(shù)據(jù)傲慢”(3)_數(shù)據(jù)分析師考試
數(shù)據(jù)素養(yǎng)
“素養(yǎng)”可以看作是素質(zhì)和修養(yǎng),是人的思維方式、能力和價(jià)值觀?,F(xiàn)在社會人與物、人與人的交互愈加密切,人的素養(yǎng)就成為現(xiàn)在社會一個(gè)非常重要的關(guān)注點(diǎn),信息技術(shù)和“數(shù)據(jù)”的社會價(jià)值越來越高,當(dāng)然對現(xiàn)代社會的人的“數(shù)據(jù)”素養(yǎng)提到一個(gè)新的高度。
“數(shù)據(jù)素養(yǎng)”包括對數(shù)據(jù)的敏感性,數(shù)據(jù)收集、處理、分析、判斷和利用的能力,尊重?cái)?shù)據(jù)倫理、保證數(shù)據(jù)準(zhǔn)確、安全和隱私的修養(yǎng)。
“數(shù)據(jù)素養(yǎng)”不再限于對信息從業(yè)人員的要求,而變成了一種對全民、尤其是年輕一代的要求,顯然沒有人可以游離在信息社會之外。非常有意思的觀察是:給幼兒智能手機(jī)類似的物品,多數(shù)幼兒都會模仿大人,用手指在屏幕上劃來劃去,好像他們的家長小時(shí)候更多是拿筆會畫一樣,這是認(rèn)知規(guī)律使然,從一個(gè)側(cè)面證明了數(shù)據(jù)素養(yǎng)是從很小年齡就可以開始訓(xùn)練和培養(yǎng)的。仍然存在的城鄉(xiāng)差異、地區(qū)差異、職業(yè)差異、教育程度差異等并沒有影響大眾一起接受智能手機(jī)、網(wǎng)絡(luò)電視、電商或“微信”,幾乎每個(gè)公民都有提高自身“數(shù)據(jù)素養(yǎng)”的需求。當(dāng)然這并不是要求非專業(yè)人員具備和專業(yè)人員同樣的技能,不同人群的“數(shù)據(jù)”技能是不同層次的,但是價(jià)值觀、倫理規(guī)范是同樣的,要判斷數(shù)據(jù)的真?zhèn)巍⒁WC數(shù)據(jù)的準(zhǔn)確、要關(guān)注數(shù)據(jù)的安全、要尊重他人的數(shù)據(jù)隱私等。
《科學(xué)》期刊2014年11月刊發(fā)費(fèi)雷德 凱特的文章,其中一個(gè)重要觀點(diǎn)是:隨著現(xiàn)代社會越來越“數(shù)據(jù)化”,如果我們依然完全依靠現(xiàn)在保護(hù)隱私的工具軟件,我們的隱私只會處于前所未有的危險(xiǎn)中。各種信息泄露。
《福布斯》期刊2015年1月5日報(bào)道,摩根士丹利發(fā)現(xiàn)其大約900名財(cái)富管理客戶的賬戶名稱和賬戶號碼被泄露在公開網(wǎng)站上,盡管客戶賬戶密碼和社會安全號碼未被泄露,當(dāng)時(shí)也還沒有證據(jù)顯示任何客戶因此遭受經(jīng)濟(jì)損失,但是足以引起社會的高度關(guān)注?!堵吠干纭?015年5月13日報(bào)道,“Uber(優(yōu)步打車)”大約5萬名司機(jī)的信息被未知第三方獲取,是一次大規(guī)模的信息泄露,該公司2014年9月在自身系統(tǒng)中發(fā)現(xiàn)一個(gè)漏洞,可讓外人在未經(jīng)授權(quán)情況下獲取部分司機(jī)的姓名和駕照號碼。雖然優(yōu)步未收到任何有關(guān)這些數(shù)據(jù)“已遭濫用的報(bào)告”,但是對于這樣敏感數(shù)據(jù)的大規(guī)模泄露還是暴露出快速發(fā)展的互聯(lián)網(wǎng)公司數(shù)據(jù)安全方面的風(fēng)險(xiǎn)。
《科學(xué)》期刊2014年3月14日發(fā)表大衛(wèi) 拉澤的文章,作者認(rèn)為:大數(shù)據(jù)集的分析是很復(fù)雜的,但是由于大數(shù)據(jù)的收集不一定有傳統(tǒng)小數(shù)據(jù)的收集過程那樣的縝密,難免出現(xiàn)失準(zhǔn)的情況,作者用谷歌流感趨勢(GFT)失準(zhǔn)作例子,指出了“大數(shù)據(jù)傲慢”是問題的根源,是大家應(yīng)該思考的問題。
谷歌認(rèn)為用戶搜索關(guān)鍵詞可以用來預(yù)測流感疫情的現(xiàn)狀,據(jù)此開發(fā)了谷歌流感趨勢(GFT),不過其結(jié)果與美國疾病預(yù)防控制中心的監(jiān)測報(bào)告相比對,2013年2月,GFT預(yù)測的流感樣病例門診數(shù)超過了CDC根據(jù)全美各實(shí)驗(yàn)室監(jiān)測報(bào)告得出的預(yù)測結(jié)果的兩倍,顯然失準(zhǔn)。
在數(shù)據(jù)公開、數(shù)據(jù)交換、數(shù)據(jù)共享和數(shù)據(jù)利用成為大勢所趨時(shí),不論是政府機(jī)構(gòu)、企業(yè)還是個(gè)人,都在創(chuàng)造數(shù)據(jù)、管理數(shù)據(jù)和使用數(shù)據(jù),每個(gè)公民在這樣的過程中遵守法律和尊重倫理是最必不可少的素養(yǎng)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11