
一個大數(shù)據(jù)屌絲的一天
馬克思說過:資本家是靠剝削剩余價值來獲取利潤的。這句話在今天有了新的含義,因為在大數(shù)據(jù)時代,人最可寶貴的已經(jīng)不再是勞動時間,也不是貞節(jié)牌坊,而是——你身上產(chǎn)生的數(shù)據(jù)。無數(shù)的互聯(lián)網(wǎng)巨頭和大數(shù)據(jù)專家們,像欣賞鹿茸和牛黃那樣,細細品味著你每天都去過哪里、吃的什么、買了幾卷衛(wèi)生紙,并用人工智能技術依次向你推送扎了洞的安全套和無痛人流醫(yī)院。 什么,你覺得這些數(shù)據(jù)還屬于你自己?我只能說,tooyoung,toosimple!讓我們以某互聯(lián)網(wǎng)屌絲小明的一天為藍本,快來看看大數(shù)據(jù)時代是如何榨取你的數(shù)據(jù)價值的吧! 小明在一家互聯(lián)網(wǎng)英語教育公司工作,主要職責是寫bug。從階級成分上看,他是互聯(lián)網(wǎng)社會的最底層——碼畜。小明不占有生產(chǎn)資料,也無法從數(shù)據(jù)變現(xiàn)的大碗里給自己撈一塊肉,只能被動地、無可奈何地,象中世紀農(nóng)奴給領主獻上初夜權那樣,主動扒光自己隱私的遮羞布,向碼皇和資本獻出自己的數(shù)據(jù),還得呲牙咧嘴地擺出被大數(shù)據(jù)臨幸后的滿足感。 一大早9點鐘,小明剛一下地鐵,手機就“叮”的一聲送來了短信:“老爺爺家鄉(xiāng)雞望京店,現(xiàn)推出十元油條豆?jié){早餐,絕對不含二手地溝油!”奇怪,這推銷來的這么精準,是怎么做到的呢?看來大數(shù)據(jù)大有可為?。≌眠€沒吃早點,干脆進去嘗嘗!【畫外音:通過GPS或者蜂窩信號,可以測得手機移動速度,當用戶在早上九點由高速運動變?yōu)榈退龠\動時,可以判斷是從地鐵出來,這時候就可以向他推薦附近的早點了?!?
吃完了早點,小明滿口地溝油的余香,慵懶地坐在了電腦邊。這時,電話鈴突然響了起來,接通后傳來一個女生的聲音:“請問先生您有提高英語口語的意愿是么?”咦,這不是同事小娜的聲音么?怎么推銷業(yè)務推銷到公司內(nèi)部來了?“是我啊,同事也不放過么?”小娜撲哧一聲樂了,放下電話走到小明身邊:“我們運營部昨兒新買了個軟件,提交一組關鍵詞上去,就能返回一批電話,打通一個才交幾塊錢,這比投搜索引擎便宜多了!”小明這才明白,原來自己昨天查過“口語培訓”這點兒事,這么快全北京的英語班兒都知道了??!【畫外音:通過運營商DPI技術,可以截取搜索引擎的搜索行為,并將其與電話號碼相關聯(lián)。】
上網(wǎng)轉轉,平復一下心情吧!可是不論打開新浪搜狐看看八卦,還是上個新華網(wǎng)學學中國夢,旁邊總有一塊狗皮膏藥一樣的廣告,上面有個中段的美女,穿著十分簡約,還配著一句廣告詞:“正品硅膠義乳,做女人挺好!”唉,都怪自己昨天為了對付指紋門卡,在某電商上看了幾個“硅膠指紋模具”,這誰還有心思看新聞啊,還是關了罷!【畫外音:根據(jù)電商的瀏覽、購買等行為,可以向用戶追身投放廣告,這稱為重定向;今天,隨著廣告程序化交易的發(fā)展,不論你看哪個網(wǎng)站,只要該網(wǎng)站接入了ADX,你就都別想跑了!】被大數(shù)據(jù)盯得這么緊,小明有點兒手足無措。好在飯點兒到了,為了盡可能躲開地溝油,小明踱出寫字樓,晃進了對面的購物中心。美食城就在購物中心的四層,小明剛邁下扶梯,手機上的“小撮點評”應用就發(fā)出了一條提醒:“歡迎您光臨吃了吐美食城,前方直行五十米右轉,廁所對面的煎餅攤今日九八折優(yōu)惠(不接受按揭)!”奇怪了,這應用怎么連我到四層都知道呢?再低頭一看自己的安卓手機,似乎又明白了什么?!井嬐庖簦哼@是利用wifi定位技術實現(xiàn)的精準室內(nèi)追蹤。當你的安卓手機wifi處于打開狀態(tài)時,會與周圍的wifi熱點握手,若干熱點可以根據(jù)你的信號強度反算出你的位置,并與你的MAC地址相關聯(lián),精準度可達米級。蘋果手機如果你打開了藍牙,也可以實現(xiàn)類似的定位。通過買來的數(shù)據(jù)將MAC與設備號映射起來,手機上的應用就能在你走下扶梯的一刻作出反應了。】
飯也沒心情吃了,還是回去干活吧!小明翻出一份數(shù)據(jù)集,這是“朝陽區(qū)大數(shù)據(jù)教會”組織的視頻推薦大賽提供的數(shù)據(jù)集,老板讓小明先看看。小明心不在焉地一行行掃著,突然,下面這條數(shù)據(jù)讓他眼前一亮:
某甲,藍貓?zhí)詺馊?2016.1.15)、喜羊羊與灰太狼(2016.2.10)、熊出沒(2016.2.16)...
雖然名字隱去了,不過還用問啊,這條記錄準是對面cubic小剛的??!這家伙弱智得只看得懂動畫片,還每天看了啥都到班上來講講。嗯?等會!除了動畫片,后面怎么還有一串東洋島國的愛情動作片兒?小明樂彎了腰,拿著電腦走到小剛面前:“看,這些片是你看的不是?”小剛當時就傻了,心下當然非常不爽,不過人家沒有寫自己的名字,還真是啞巴吃黃連。
【畫外音:即使沒有姓名、電話這些個人可定位信息,對目標用戶有一定背景信息了解的熟人,也通過互聯(lián)網(wǎng)稀疏行為數(shù)據(jù)對應到個人從而獲取更多隱私。新興的“差分隱私”技術,也是為了克服這一難題?!?
一波未平,一波又起,小明剛剛坐定,電腦右下角的企鵝嘟嘟嘟叫起來,是小明的同學小宏,現(xiàn)在在某大互聯(lián)網(wǎng)公司上班?!袄贤瑢W,你上周去東莞干啥了?怎么還搜了'發(fā)廊'這個詞?你可別犯錯誤啊!”“少廢話,我上東莞是給公司出差去了,理個發(fā)還不行么?不對啊,你怎么知道的???”“嘿嘿,我在這邊搜索團隊啊,你不是拿手機號注冊的我們應用么?”小明放下電話,默默地刪除了“盯梢搜索”這個應用。【畫外音:絕非危言聳聽,有很多互聯(lián)網(wǎng)公司、甚至包括一些大公司,內(nèi)部對數(shù)據(jù)使用規(guī)范性的管理混亂到了令人發(fā)指的程度。像上文這樣的情形并不是虛構?!俊靶∶鞯目爝f!”門口又響起了熟悉的快遞員喊聲,“到付的,一百塊錢!”小明一時想不起來是什么,不過經(jīng)常在網(wǎng)上買東西,到付的也不少,也就沒多琢磨。把一百塊錢遞給快遞員,一邊往回走一邊拆包裹:紙盒子里面拿出個泡沫塑料袋,泡沫塑料袋里面是個牛皮紙包,牛皮紙包里面是個牛皮紙袋,牛皮紙袋里面有個信封兒,信封撕開一開,有一張小紙條,上書兩個大字:“撓撓!”小明當時兩眼發(fā)直,一口血差點噴在紙條上,這么個玩意兒就蒙了我一百塊錢??!
【畫外音:不法分子通過各種手段批量買到用戶的地址和電話,通過發(fā)到付快遞的方式可以大規(guī)模獲利,至于數(shù)據(jù)從哪兒買到的,前一段某電商數(shù)據(jù)部門被開除的事兒,您還有印象吧!】
天黑了,終于熬到了9點的下班點兒,“嘟嘟”打車軟件如約發(fā)來消息:“您下班時間快到了,要不要再給您預約去保利會所的專車呢?“小明心說:”那是昨天跟老板陪客戶去的,天天去哪有那美事兒?我還是騎著單車奔城鄉(xiāng)結合部租的8平米小復式吧!“
【畫外音:根據(jù)個性化數(shù)據(jù)進行的推薦,應該在沒有用戶主動意圖時盡量保守一些,否則會帶來不好的體驗,也會讓更多人質(zhì)疑隱私使用的合法性?!?
好容易到了自己租的小屋,可以忘掉這驚悚的一天了吧!小明想蹲會兒馬桶,一個人靜靜。屁股剛往馬桶圈上一沾, 胯下的大數(shù)據(jù)智能馬桶就開始發(fā)言:“根據(jù)您的毛細血管進行光學臀相分析,發(fā)現(xiàn)您血色稠暗,可能是二手地溝油攝入過多;另外臀堂發(fā)暗,可能是被人窺視私密之事受驚嚇所致,建議您珍愛生命,遠離地溝油和大數(shù)據(jù)!” 當時,小明嚇得便意全無,不由得抬頭望了望窗外的繁星,似一串串0和1那般閃爍跳躍,頓覺在大數(shù)據(jù)時代,雖有大地之廣,宅院之深,卻無半點屌絲立錐之地.....
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10