
大數(shù)據(jù)時(shí)代(2)有關(guān)收集數(shù)據(jù)的二三談
互聯(lián)網(wǎng)時(shí)代下,收集數(shù)據(jù)變得十分簡(jiǎn)單而且成本超便宜。即使你僅僅在討論區(qū)留言、 Twitter 或 FB 發(fā)表一段文字,它都會(huì)變成新的信息,成為大數(shù)據(jù)的一部份??梢哉f你的生活離不開這片無限巨網(wǎng),即使你不上網(wǎng),手上的付款裝置同樣有機(jī)會(huì)出賣你,讓你成為大數(shù)據(jù)提供者之一。
大數(shù)據(jù)讓商業(yè)世界形成新的革命
一是它創(chuàng)造了數(shù)據(jù)收集企業(yè),簡(jiǎn)單點(diǎn)就是互聯(lián)網(wǎng)服務(wù)提供者以及各大社交媒體。不管你有意或無意,只要你使用它們留下足跡,你的行動(dòng)就有機(jī)會(huì)成為數(shù)據(jù)。不用懷疑你的數(shù)據(jù)有沒有價(jià)值,大數(shù)據(jù)從不關(guān)心這些事,無論是本身的價(jià)值或內(nèi)在價(jià)值,甚至包括那些看似無用的資料,都會(huì)落入系統(tǒng)進(jìn)行演算消化,然后在某次統(tǒng)計(jì)中可能抽取利用。收集的數(shù)據(jù)越多,越具有影響力,越能演算出更準(zhǔn)確的答案。
二是利用大數(shù)據(jù)的中介公司,大數(shù)據(jù)收集和利用是兩回事,不是每一間公司有能力寫出演算程式,亦有些公司有程式卻沒有足夠的數(shù)據(jù)進(jìn)行分析,這樣子雙方就有需求,產(chǎn)生這類販?zhǔn)奂袄么髷?shù)據(jù)的「中間人」企業(yè)。
三是知道大數(shù)據(jù)并利用它獲取利益及增進(jìn)企業(yè)競(jìng)爭(zhēng)力的公司,它們具有高度的適應(yīng)性,早一步明白大數(shù)據(jù)的威力,并確實(shí)掌握及成功利用。傳統(tǒng)企業(yè)過去經(jīng)營時(shí)往往需要找專家分析,又或委託市場(chǎng)調(diào)查公司就某一企劃進(jìn)行調(diào)查。然而有大數(shù)據(jù)后,它們直接由大數(shù)據(jù)中求出答案,其準(zhǔn)確及實(shí)用性不輸專家及獨(dú)立調(diào)查報(bào)告,而成本可能更便宜。
大數(shù)據(jù)不是百利無害
當(dāng)然大數(shù)據(jù)不是百利無害,上面分析這么多,整個(gè)「大數(shù)據(jù)價(jià)值鏈」中,個(gè)人用戶幾乎是最低層。好比耕田的農(nóng)夫,數(shù)據(jù)本身就是源自他們生產(chǎn),但處于供應(yīng)鏈最底層的他們最后并沒有從中獲得多大的利益,甚至個(gè)人權(quán)益會(huì)受侵害。
RADICA DATA LAB 發(fā)佈的「大數(shù)據(jù)市場(chǎng)應(yīng)用調(diào)查」也有類似的報(bào)告,調(diào)查發(fā)現(xiàn)接近七成(67%)的受訪者知道品牌公司會(huì)透過收集他們的行為數(shù)據(jù)來分析他們的喜好及行為。超過六成半的被訪者(66%)表示如果品牌公司清楚告訴被訪者它會(huì)如何使用他們的個(gè)人資料,會(huì)增加對(duì)品牌的好感,而只有不足兩成的被訪者表示反感(19%)。
年青人雖然喜歡用社交網(wǎng)絡(luò),卻不愿意被收集行為數(shù)據(jù)
調(diào)查報(bào)告同時(shí)有些奇怪的現(xiàn)象反映,在收集個(gè)人資料類別方面,大眾最接受被收集及使用以用作提供更貼心的產(chǎn)品和服務(wù)的前三名分別是性別(76%)、年齡(62%)及電郵地址(51%)。在行為數(shù)據(jù)方面,最多人接受的是購買紀(jì)錄(43%),其次是閱讀過推廣電郵(27%)及下載 Mobile App (21%)。反而最流行的社交媒體上讚好和評(píng)論等(18%)及「打咭」(14%)只排在第四和第五的位置。
負(fù)責(zé)今次調(diào)查的香港科技大學(xué)同益實(shí)業(yè)集團(tuán)電子商貿(mào)中心主任譚嘉因教授指出年青人雖然喜歡用社交網(wǎng)絡(luò),卻不愿意被收集行為數(shù)據(jù),反映他們不太認(rèn)識(shí)大數(shù)據(jù)的概念及實(shí)際收集和應(yīng)用模式。
對(duì)筆者而言這些結(jié)果都是正面及可理解的,畢竟資料的保存及利用是雙面刃,它們採集的資料只需要徵得用戶「當(dāng)時(shí)」的同意,但「之后」利用幾多次甚至保存幾百年都不再需要詢問當(dāng)事人。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
2025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù)》一書中指出:AI思維, ...
2025-07-17數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10