
近年來不斷熱議的大數(shù)據(jù),已經(jīng)不僅僅是一個IT領(lǐng)域的未來發(fā)展趨勢問題了,而是整個人類社會邁向更加智能、高效的標(biāo)志。然而,大數(shù)據(jù)和任何一個科學(xué)技術(shù)一樣,它的發(fā)展并不能離開社會道德的約束,更不能背離IT技術(shù)發(fā)展的初衷,在某種程度上我們可以說,大數(shù)據(jù)不僅是個技術(shù)問題、商業(yè)問題,其實更是一個“哲學(xué)問題”。
哲學(xué)問題,歸根結(jié)底都會講究一個“度”,尤其是這種作為技術(shù)手段幫助人類挖掘數(shù)據(jù)、實現(xiàn)更高效智能化分析和業(yè)務(wù)決策的大數(shù)據(jù)來說,更需要有一個“度”來約束。也就是說,任何事物或者工具的應(yīng)用,都應(yīng)該有一個“邊界”,觀念和時尚中的“跨界”并不能“放之四海而皆準(zhǔn)”。過于透明會讓人無所適從和不合情理。
這類例子數(shù)不勝數(shù),比如某個女孩平日經(jīng)常關(guān)注如何瘦身、豐胸,當(dāng)她與朋友去商場購物的時候,總被豐胸瘦身產(chǎn)品的促銷人員圍住做宣揚……亦或者出于好奇而在網(wǎng)上搜索“棺材”,于是接下來的一個月內(nèi),打開的微博、網(wǎng)站、電商等網(wǎng)站都會給他展示、推薦相關(guān)產(chǎn)品,讓其連續(xù)一個月“被看”骨灰盒。
1針對“被推薦”廣告,網(wǎng)友小陳發(fā)微博吐槽
當(dāng)然,這些并不是大數(shù)據(jù)本身的問題,而是大數(shù)據(jù)參與者——“人”的問題。但正是由于參與的主體 ,包括數(shù)據(jù)的采集、傳輸、存儲、處理、分析等一系列環(huán)節(jié)中的人及其所使用的平臺和技術(shù),會因為 “人”的問題會使得結(jié)果會不易控制或者變得泛濫。
基于此,本文將會從安全隱私、商業(yè)價值和數(shù)據(jù)真?zhèn)味鄠€角度對大數(shù)據(jù)問題進行剖析,為大家揭示一個“大數(shù)據(jù)給賣萌空間,智慧給情感騰地兒”的道理。
2大數(shù)據(jù)需要拒絕“數(shù)據(jù)暴政”
大數(shù)據(jù)的威力從興起之初就可以得到體現(xiàn)。難道不是么?在云計算還剛剛興起還未被人們完全接納、采用的時候,大數(shù)據(jù)就已經(jīng)被推到了歷史舞臺的面前。
在一些公司、實驗室和政府機構(gòu),“數(shù)據(jù)”被捧為21世紀(jì)新型“石油”或“黃金”。因為大數(shù)據(jù)能夠給人們帶來更多市場機會和商業(yè)價值,而實現(xiàn)這些價值所需要的技術(shù)手段,其本身也會給大數(shù)據(jù)服務(wù)商、軟件和硬件等基礎(chǔ)設(shè)施提供商帶來巨大利益。
在眾多利益面前,往往容易產(chǎn)生一種“沖動行為”,也就是為實現(xiàn)利益而產(chǎn)生的驅(qū)動力。在這種背景下,大數(shù)據(jù)時代也難免會帶來一些“數(shù)據(jù)暴政”類似的副作用。
高逼格當(dāng)賣萌遇上大數(shù)據(jù),情感面臨智慧大考
如果有人在“臉譜”上表示“喜歡”某款牛仔褲,當(dāng)他下次進入該店鋪時,就可能收到店主給他發(fā)送的同品牌牛仔褲的打折信息??雌饋?,這對零售商和消費者都有好處,但主張保護數(shù)據(jù)隱私的人卻認為,“大數(shù)據(jù)”理念其實與“專制獨裁”沒有區(qū)別。
在線期刊《科學(xué)報道》近期一項研究顯示,每個人有自己的行動模式,95%的人可能被識別。普林斯頓計算機科學(xué)家阿爾溫德·納拉亞南在其博客上說,可供分析的數(shù)據(jù)越多,就越不可能保持“匿名”,識別一個人只要33個字節(jié)的信息量。
數(shù)據(jù)分析能預(yù)測你的孩子在學(xué)校表現(xiàn)如何,他將來適合怎樣的工作,誰有多大幾率犯罪或得癌癥,電視臺和唱片公司能根據(jù)預(yù)測迎合觀眾或聽眾的口味……但在這個一切都計算好的世界里,創(chuàng)意、靈感和驚喜在哪里?互聯(lián)網(wǎng)哲學(xué)家葉夫根尼·莫羅佐夫?qū)υS多“大數(shù)據(jù)”應(yīng)用程序背后的意識形態(tài)提出尖銳批評,警告即將發(fā)生“數(shù)據(jù)暴政”。他提出,那些“大數(shù)據(jù)”應(yīng)用程序應(yīng)當(dāng)接受獨立審計人定期審查,以防權(quán)力濫用。
3大數(shù)據(jù)需要時刻“見縫插針”
大數(shù)據(jù)能夠為人熟知、接納,根本上是因為它能幫助創(chuàng)造廣闊的商業(yè)價值。當(dāng)然,并不僅僅是商業(yè)價值,也能給科研、學(xué)術(shù)、技術(shù)發(fā)明和天文探索、自然地理等等,都可以帶來更高的生產(chǎn)力。
在商業(yè)領(lǐng)域的價值呈現(xiàn),這點非常明顯,也無需低估這股市場“沖動”的力量。
通過對大數(shù)據(jù)的采集處理和分析,可以幫助人們做出更快更準(zhǔn)確的業(yè)務(wù)決策,通過大數(shù)據(jù)的形式可以建立智能化的平臺,實行個性化的營銷行為,對消費者進行具體的精準(zhǔn)的分析。
從大數(shù)據(jù)業(yè)務(wù)特征來看,數(shù)據(jù)爆炸增長,結(jié)構(gòu)類型復(fù)雜,用戶行為豐富,Web社群關(guān)系復(fù)雜。需求分析方面利用大數(shù)據(jù)分析提升用戶體驗,增加用戶黏性。具體應(yīng)用方面是社交網(wǎng)絡(luò)廣告精準(zhǔn)投放。
在提升企業(yè)信息管理能力方面,經(jīng)過大數(shù)據(jù)時代用戶行為模式的分析,可以做到最有價值的信息進行歸檔保存,精簡合并任務(wù)、信息即服務(wù)、豐富數(shù)據(jù)內(nèi)容、信息追蹤機制、公司治理過程,還有面向大數(shù)據(jù)的企業(yè)管理方面,可以提升公司的治理效果。大數(shù)據(jù)的價值還可以改進企業(yè)商業(yè)決策,傳統(tǒng)做法是結(jié)構(gòu)化、可分析,邏輯性。新的路徑是提高了創(chuàng)造性和整體思維能力,以及提高用戶的知覺。
這種無處不在、受商業(yè)利益驅(qū)動的“見縫插針”,其實也更需要在科研、公益等領(lǐng)域獲得同等對待。比如智能城市、物聯(lián)網(wǎng)、學(xué)術(shù)研究以及人類面臨的人口問題、環(huán)境問題、能源問題,等等。
高逼格當(dāng)賣萌遇上大數(shù)據(jù),情感面臨智慧大考
大數(shù)據(jù)時代下的智慧城市
智慧城市要體現(xiàn)出人類社會對現(xiàn)代城市和運營管理新的科技發(fā)展的水平,智慧,它必然來自于對大數(shù)據(jù)充分分析和利用,大數(shù)據(jù)源于非結(jié)構(gòu)數(shù)據(jù)的猛增包括互聯(lián)網(wǎng)的發(fā)展,使得數(shù)量級不斷的提高。因此如何對數(shù)據(jù)進行分析和利用,促進人類智慧運用管理城市,正是大數(shù)據(jù)面臨的挑戰(zhàn)和機遇。智慧城市必然催生大數(shù)據(jù)運營行業(yè)的發(fā)展,包括大數(shù)據(jù)的采集、呈現(xiàn)力等等。未來幾年智慧城市產(chǎn)生預(yù)期發(fā)展效果,必然會出現(xiàn)非常重要的圍繞大數(shù)據(jù)運營和管理新的行業(yè)和龍頭企業(yè)。
不過,這些公共利益領(lǐng)域的大數(shù)據(jù)應(yīng)用,勢必也會不斷升溫,不過相比商業(yè)領(lǐng)域會稍微滯后一點。而對于互聯(lián)網(wǎng)等新興IT領(lǐng)域,大數(shù)據(jù)將會成為主要應(yīng)用平臺。
4大數(shù)據(jù)需要“去偽存真”
大數(shù)據(jù)面前,恍若“智慧大師”一般,會讓很多人類的情感變得沒有了神秘感。各種“賣萌”、情緒和感性,在大數(shù)據(jù)面前,也會變得透明甚至幾分滑稽。不過,這些都不是根本問題,最值的關(guān)心的是,大數(shù)據(jù)的“數(shù)據(jù)”的來源是否真實可靠?……
可以想象,如果監(jiān)控探頭采集到的數(shù)據(jù)都是過時的(被人為侵入系統(tǒng)篡改時間)或者人為偽造采集到的數(shù)據(jù),那么這些海量數(shù)據(jù)收集起來并對其進行分析處理的最后結(jié)果,將不僅不利于做出正確決策幫助提升效率,相反,還將會給現(xiàn)有和未來的趨勢發(fā)展帶來嚴(yán)重的誤判,并最終造成海量資源的浪費。
高逼格當(dāng)賣萌遇上大數(shù)據(jù),情感面臨智慧大考
颶風(fēng)“桑迪”襲擊美國
除了數(shù)據(jù)本身是否為真之外,還存在數(shù)據(jù)來源是否適配需要分析的結(jié)構(gòu)模型。比如,如果我們在Twitter上分析颶風(fēng)“桑迪”的相關(guān)數(shù)據(jù),在2012年10月 27日到11月1日期間, 約有2000萬條推文。有人研究了與颶風(fēng)“桑迪”相關(guān)的Twitter和Foursquare的數(shù)據(jù)。發(fā)現(xiàn)了一些預(yù)期中的結(jié)果(如在“桑迪”來的前夜, 人們?nèi)コ匈徫锪考ぴ觯且舶l(fā)現(xiàn)了一些預(yù)料外的結(jié)果(比如在“桑迪”過后的一天人們的夜生活開始增加)。
然而, 這些數(shù)據(jù)并不能反映問題的全貌。 關(guān)于“桑迪”的推文的一大部分來自于曼哈頓地區(qū)。 這一點可以理解, 因為曼哈頓地區(qū)的智能手機和Twitter使用率很高。 不過, 這樣的數(shù)據(jù)會給人們一個錯覺, 那就是曼哈頓是這次颶風(fēng)災(zāi)難的中心。 事實上, 來自那些受災(zāi)更加嚴(yán)重地區(qū)比如說Breezy Point, Coney島和 Rockway的推文少的可憐。而由于電力中斷,來自那些受災(zāi)最嚴(yán)重地區(qū)的推文幾乎沒有。 事實上, 對推文的分析,并不能反映那些曼哈頓之外的地區(qū)的真實情況。我們可以把這種問題成為“信號故障”,也就是說,數(shù)據(jù)本來應(yīng)該真實地反映社會的整體情況, 而由于數(shù)字鴻溝,來自有些特定的群體的信號沒有被接收到。
綜上,從之前介紹的商業(yè)價值、安全隱私和去偽存真三大方面,我們不難看出,大數(shù)據(jù)由于去發(fā)展之迅猛、規(guī)模之大,使得它以及掙脫了傳統(tǒng)IT技術(shù)應(yīng)用的范疇,而更多了被賦予哲學(xué)理念的色彩??梢韵胂?,失去哲學(xué)思考的“大數(shù)據(jù)”,會猶如失去理性的人類擴張一樣,不僅破壞資源更會破壞人類社會自身的平衡。而這,恰恰是本文所要傳達的主旨。
大數(shù)據(jù)并不是技術(shù),通過用戶使用的平臺和技術(shù)問題的分析與解決,從安全隱私、商業(yè)價值和數(shù)據(jù)真?zhèn)味鄠€角度對大數(shù)據(jù)問題進行剖析。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11