
大數(shù)據(jù)思維的核心是落實到價值上_數(shù)據(jù)分析師培訓(xùn)
數(shù)據(jù)現(xiàn)在是個熱點詞匯,關(guān)于有了大數(shù)據(jù),如何發(fā)揮大數(shù)據(jù)的價值,議論紛紛,而筆者以為,似乎這有點搞錯了原因與結(jié)果,就象關(guān)聯(lián)關(guān)系,有A的時候,B與之關(guān)聯(lián),而有B的時候,A卻未必關(guān)聯(lián),筆者還是從通常的4個V來描述一下我所認(rèn)為的大數(shù)據(jù)思維。
首先是大數(shù)據(jù)的量,數(shù)據(jù)量足夠大,達(dá)到了統(tǒng)計性意義,才有價值 。 筆者看過的一個典型的案例就是,例如傳統(tǒng)的,收集幾千條數(shù)據(jù),很難發(fā)現(xiàn)血緣關(guān)系對遺傳病的影響,而一旦達(dá)到2萬條以上,那么發(fā)現(xiàn)這種影響就會非常明顯。那 么對于我們在收集問題時,是為了發(fā)現(xiàn)隱藏的知識去收集數(shù)據(jù),還是不管有沒有價值地收集,這還是值得商榷的。其實收集數(shù)據(jù),對于數(shù)據(jù)本身,還是可以劃分出一 些標(biāo)準(zhǔn),確立出層級,結(jié)合需求、目標(biāo)來收集,當(dāng)然有人會說,這樣的話,將會導(dǎo)致巨大的偏差,例如說喪失了數(shù)據(jù)的完整性,有一定的主觀偏向,但是筆者以為, 這樣至少可以讓收集到的數(shù)據(jù)的價值相對較高。
第二是大數(shù)據(jù)的種類, 也可以說成數(shù)據(jù)的維度,對于一個對象,采取標(biāo)簽化的方式,進(jìn)行標(biāo)記,針對需求進(jìn)行種類的擴(kuò)充,和數(shù)據(jù)的量一樣,筆者認(rèn)為同樣是建議根據(jù)需求來確立,但是對 于標(biāo)簽,有一個通常采取的策略,那就是推薦標(biāo)簽和自定義標(biāo)簽的問題,分類法其實是人類文明的一大創(chuàng)舉,采取推薦標(biāo)簽的方式,可以大幅度降低標(biāo)簽的總量,而 減少后期的規(guī)約工作,數(shù)據(jù)收集時擴(kuò)充量、擴(kuò)充維度,但是在數(shù)據(jù)進(jìn)入應(yīng)用狀態(tài)時,我們是希望處理的是小數(shù)據(jù)、少維度,而通過這種推薦、可選擇的方式,可以在 標(biāo)準(zhǔn)化基礎(chǔ)上的自定義,而不是毫無規(guī)則的擴(kuò)展,甚至用戶的自定義標(biāo)簽給予一定的限制,這樣可以使維度的價值更為顯現(xiàn)。
第三是關(guān)于時效性, 現(xiàn)在進(jìn)入了讀秒時代,那么在很短的時間進(jìn)行問題分析、關(guān)聯(lián)推薦、決策等等,需要的數(shù)據(jù)量和數(shù)據(jù)種類相比以前,往往更多,換個說法,因為大數(shù)據(jù)時代時效性要 求高了,所以處理數(shù)據(jù)的方式變了,以前可能多人處理,多次處理,現(xiàn)在必須變得單人處理、單次處理,那么相應(yīng)的信息系統(tǒng)、工作方式、甚至企業(yè)的組織模式,管 理績效都需要改變,例如筆者曾經(jīng)工作的企業(yè),上了ERP系統(tǒng),設(shè)計師意見很大,說一個典型案例,以往發(fā)一張變更單,發(fā)出去工作結(jié)束,而上了ERP系統(tǒng)以 后,就必須為這張變更單設(shè)定物料代碼,設(shè)置需要查詢物料的存儲,而這些是以前設(shè)計師不管的,又沒有為設(shè)計師為這些增加的工作支付獎勵,甚至因為物料的缺少 而導(dǎo)致變更單不能發(fā)出,以至于設(shè)計師工作沒有完成,導(dǎo)致被處罰。但是我們從把工作一次就做完,提升企業(yè)的工作效率角度,這樣的設(shè)計變更與物料集成的方式顯 然是必須的。那么作為一個工作人員,如何讓自己的工作更全面,更完整,避免王府,讓整個企業(yè)工作更具有時間的競爭力,提高數(shù)據(jù)的數(shù)量、種類、處理能力是必 須的。
第四關(guān)于大數(shù)據(jù)價值, 一種說法是大數(shù)據(jù)有大價值,還有一種是相對于以往的結(jié)構(gòu)化數(shù)據(jù)、少量數(shù)據(jù),現(xiàn)在是大數(shù)據(jù)了,所以大數(shù)據(jù)的單位價值下降。筆者以為這兩種說法都正確,這是一 個從總體價值來看,一個從單元數(shù)據(jù)價值來看的問題。而筆者提出一個新的關(guān)于大數(shù)據(jù)價值的觀點,那就是真正發(fā)揮大數(shù)據(jù)的價值的另外一個思路。這個思路就是針 對企業(yè)的問題,首先要說什么是問題,筆者說的問題不是一般意義上的問題,因為一說問題,大家都以為不好、錯誤等等,而筆者的問題的定義是指狀態(tài)與其期望狀 態(tài)的差異,包括三種模式,第一是通常意義的問題,例如失火了,必須立即撲救,其實這是三種模式中最少的一種;第二種模式是希望保持狀態(tài),第三種模式是期望 的狀態(tài),這是比原來的狀態(tài)高一個層級的。
我們針對問題,提出一系列解決方案,這些解決方案往往有多種,例如員工 的培訓(xùn),例如設(shè)備的改進(jìn),例如組織的方式的變化,當(dāng)然解決方案包括信息化手段、大數(shù)據(jù)手段,我們一樣需要權(quán)衡大數(shù)據(jù)的方法是不是一種相對較優(yōu)的方法,如果 是,那么用這種手段去解決,那么也就是有價值了。例如筆者知道的一個案例,一個企業(yè)某產(chǎn)品部件偶爾會出現(xiàn)問題,企業(yè)經(jīng)歷數(shù)次后決定針對設(shè)備上了一套工控系 統(tǒng),記錄材料的溫度,結(jié)果又一次出現(xiàn)問題時,進(jìn)行分析認(rèn)為,如果工人正常上班操作,不應(yīng)該有這樣的數(shù)據(jù)記錄,而經(jīng)過與值班工人的質(zhì)詢,值班工人承認(rèn)其上晚 班時睡覺,沒有及時處理。再往后,同樣的問題再沒有再次發(fā)生。
總結(jié)起來,筆者以為大數(shù)據(jù)思維的核心還是要落實到 價值上,面向問題,收集足夠量的數(shù)據(jù),足夠維度的數(shù)據(jù),達(dá)到具有統(tǒng)計學(xué)意義,也可以滿足企業(yè)生產(chǎn)、客戶需求、甚至競爭的時效要求,而不是一味為了大數(shù)據(jù)而 大數(shù)據(jù),這樣才是一種務(wù)實、有效的正確思維方式,是一線大數(shù)據(jù)的有效的項目推進(jìn)方式,在這樣的思維模式基礎(chǔ)上,采取滾雪球方式,把大數(shù)據(jù)逐步展開,才真正 贏來大數(shù)據(jù)百花齊放的春天
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘龌蚴窃诼殘稣媾R崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時代的價值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競爭力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價值的橋梁? 在數(shù)據(jù)驅(qū)動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11