
基于你的點(diǎn)贊軌跡,數(shù)據(jù)挖掘可以探知你的性格秘密
整理了一些社交媒體數(shù)據(jù)挖掘的結(jié)果,你會發(fā)現(xiàn),大數(shù)據(jù)、行為痕跡和社交媒體的結(jié)合,展現(xiàn)了無限的機(jī)會和可能。例如,基于臉書的挖掘,可以探知你的智商、神經(jīng)質(zhì)、生活滿意度、宗教信仰、單身與否、身材發(fā)福、產(chǎn)后郁郁、話題偏好和輿情監(jiān)測等。
美國科學(xué)院院報(bào)(PNAS)最近的一篇研究表明,在社交網(wǎng)站上別輕易點(diǎn)贊,因?yàn)辄c(diǎn)贊能夠泄露你一些比較私密的性格特質(zhì)?;谏缃痪W(wǎng)站上(例如 Facebook)的點(diǎn)贊,可以計(jì)算出你的性格特征(大五人格The Big Five),通過算法計(jì)算的結(jié)果比你的朋友、同學(xué)、親人判斷的更準(zhǔn)。
研究過程。具體的做法就是,作者邀請臉書上8.6萬志愿者參與一項(xiàng)性格測試,并且收集了他們的“點(diǎn)贊”數(shù)據(jù)(即對什么帖子或內(nèi)容發(fā)生點(diǎn)贊行為)。并 且邀請了被試的親朋好友參與測試,給出有關(guān)該被試性格的評價。這樣就有關(guān)于被試的三份性格數(shù)據(jù),一份是自我的評價,一份是親朋好友的評價,一份是基于點(diǎn)贊 數(shù)據(jù)計(jì)算的結(jié)果。研究結(jié)果表明,算法得到的性格傾向指數(shù)比親朋好的判斷更為準(zhǔn)確。
點(diǎn)贊和特質(zhì)。點(diǎn)贊的時候,我們希望向臉書好友展示我們對特定內(nèi)容(包括狀態(tài)更新、照片、書籍、產(chǎn)品、音樂)的積極態(tài)度。但是,與此同時,“點(diǎn)贊”行 為也暴露了你很多的私密信息、敏感特質(zhì)、性格偏好和行為傾向等。例如宗教信仰、政治觀點(diǎn)、性取向和酒量等。而且,通常一個點(diǎn)贊(例如點(diǎn)贊了某一篇分享)就 能夠產(chǎn)生較為精準(zhǔn)的預(yù)測。一些結(jié)論舉例如下。
具體的,大概只需要10個“贊”,計(jì)算機(jī)就能比同事更準(zhǔn)確的判斷你的性格。通過70個“贊”,電腦就能超過其朋友。140個“贊”便超過其家人(父母親兄妹)。300個“贊”則能“擊敗”你的伴侶。
狀態(tài)更新和單身判斷。發(fā)現(xiàn)顏高妹子的時候,小伙伴們冒出的第一個念頭,她是不是單身哈。告訴你一個福音,臉書幫你解決這個問題了。
臉書通過上百萬的狀態(tài)更新的數(shù)據(jù),基于更新內(nèi)容進(jìn)行文本分析,識別一些特征變量,從而判斷和預(yù)測用戶何時從單身狀態(tài)變成戀愛中狀態(tài)。進(jìn)一步地,臉書 聯(lián)合企業(yè)將研究結(jié)論進(jìn)行商業(yè)應(yīng)用,即向個人頁面首頁投放相關(guān)的產(chǎn)品廣告。例如,向戀愛中的用戶提供產(chǎn)品(買一贈一、情侶折扣等),或者向失戀的用戶提供產(chǎn) 品(紙巾、Ben&Jerry的冰激凌等)。
朋友圈,你常常會收藏一些內(nèi)容和文檔。其實(shí),通過你的收藏,也是可以判斷你高度敏感的個人特征的。例如性取向、生活滿意度、智力、情感穩(wěn)定性、宗教信仰、過度飲酒習(xí)慣、年齡、性別、種族、政治觀點(diǎn)等。
臉書上每個人都需要上傳自己的頭像?;谟脩舻念^像,臉書可以做什么事情呢?人臉識別技術(shù)。
人臉識別是指,基于面部特征,分析五官的相對位置、尺寸、形狀等,保存最為突出的特點(diǎn),將圖像數(shù)據(jù)轉(zhuǎn)化為矩陣數(shù)據(jù),以便面部識別。
對用戶的頭像進(jìn)行人臉識別后,臉書會檢索整個互聯(lián)網(wǎng),看看這些照片還在哪里出現(xiàn)過,看看是否出現(xiàn)在別人的合影中,猜測你可能會認(rèn)識哪些人,從而向你推薦一些二度三度的朋友。
另外一方面,臉書也會將照片與公司網(wǎng)站、在線相親網(wǎng)站進(jìn)行匹配,或者從最新發(fā)表的博客或文章中尋找有關(guān)你的更多的信息。從而了解你的職業(yè)、興趣、偏好和行為傾向等。
谷歌眼鏡和社交媒體。之前看過一個視頻,描繪的就是一個小伙伴帶上谷歌眼鏡后,遇到一個陌生人,迅速通過谷歌眼鏡找到很多有關(guān)這個陌生人的信息。想在想一想,這也是可以實(shí)現(xiàn)的。
谷歌眼鏡需求和臉書的合作。谷歌自己開發(fā)了一套Nametag技術(shù)。基于該技術(shù),當(dāng)遇到陌生人時,谷歌眼鏡通過拍照,把人臉上傳,丟到臉書上進(jìn)行人臉識別。從而匹配到該陌生人的職業(yè)、年齡、生日、動態(tài)、朋友圈、日志、狀態(tài)和最近的興趣等。
現(xiàn)在有些公司,借助社交媒體內(nèi)容,進(jìn)行潛在員工的篩選。招聘方通過個人資料,例如臉書,抓取臉書上的個人信息,基于信息和網(wǎng)絡(luò)環(huán)境中個體表現(xiàn)出來的特質(zhì),判斷和預(yù)測個體的智力水平和情緒穩(wěn)定性。從而作為員工錄用的一個參考的標(biāo)準(zhǔn)。
頭像變化分析。在臉書上,每個人的頭像都不會一成不變的,間隔一段時間,大家就會采用新的頭像或自拍照。你在進(jìn)行頭像更新時,臉書就在思考另外一件事,即他們通過人臉識別技術(shù),判斷前后頭像是否存在差別,即你是否變胖了。
如果圖像分析的結(jié)果表明,你確實(shí)發(fā)福了,恰好你的性別又是女性的話,臉書很可能就會聯(lián)合一些減肥、健身、保健公司,向你的個人頁面,精準(zhǔn)的推送一些折扣券。
越來越多的公司關(guān)心員工的福祉,關(guān)心員工的生活狀態(tài),并且及時的進(jìn)行涉入和干預(yù),以便你快樂工作和快樂生活。
一家公司就通過分析女性員工社交媒體上的發(fā)帖和話題(例如微博、臉書、Twitter)來判斷她們是否存在陷入產(chǎn)后抑郁癥的風(fēng)險(xiǎn)。通過抓取女性員工在生產(chǎn)前后幾周在社交媒體上的話題和發(fā)言,摘取其所使用的動詞。
分析結(jié)果表明,有抑郁癥傾向的母親常常會使用暗示“焦慮”和“不高興”的話。發(fā)言中一般會包含一些貶義詞,例如“失望”、“痛苦”、“討厭”等,暗示著失望情緒的瘋長。
2013年臺風(fēng)席卷菲律賓時,通過社交媒體臉書上PO的照片數(shù)據(jù),人們繪制一幅救災(zāi)線路圖。
發(fā)生災(zāi)難時,人們常常會將自己親身經(jīng)歷的照片、文本、視頻發(fā)布到社交媒體上。研究者們對人們上傳的照片進(jìn)行分析和挖掘。對于一張受災(zāi)照片,“損害程 度如何?通過點(diǎn)擊按鈕確定,無、中度、嚴(yán)重”。對于Facebook或Twitter文本信息,判斷文本的類型即“尋求幫助”、“基礎(chǔ)設(shè)施損壞”、“人口 流失”、“相關(guān)但屬于其他”等分類。
然后通過確認(rèn)數(shù)據(jù)來自菲律賓的哪個地方,通過照片或文本發(fā)送時攜帶的GPS傳感信息來定位,從而繪制一個受災(zāi)地圖。
通過這個救災(zāi)地圖,就可以得知,誰需要什么、誰需要食物、尸體在哪里、哪里有流離失所的人、哪里受到的災(zāi)難較為嚴(yán)重、什么醫(yī)院損傷最小。從而為救災(zāi)提供了最一手、最新鮮的信息。
很多公司目前都跟在蹤和監(jiān)測社交媒體上與品牌相關(guān)的詞匯(產(chǎn)品、品牌、競爭者、品牌代言人、政策趨勢等),并進(jìn)行情感和話題分析,了解人們在網(wǎng)絡(luò)上如何討論公司及其產(chǎn)品。
社交媒體也是一個早期的預(yù)警系統(tǒng)。當(dāng)消費(fèi)者對產(chǎn)品或服務(wù)不太滿意時,他們會在社交媒體上吐槽,企業(yè)迅速捕捉此類信息,并且進(jìn)行產(chǎn)品服務(wù)改良,控制負(fù)面消息的擴(kuò)散和傳播。
通過社交媒體的這些案例,想要表達(dá)什么呢?大概幾點(diǎn)。
第一,不管你有沒有意識,你的很多行為都會留下數(shù)字痕跡。文本(微博)、視頻(優(yōu)酷土豆等)、音頻(客服電話)、圖片(朋友圈)、傳感器數(shù)據(jù)(手環(huán)、手機(jī)內(nèi)置的傳感器)等。
第二,別否認(rèn),機(jī)器和算法有時候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸來說,基于數(shù)據(jù)挖掘,計(jì)算機(jī)是能夠推斷出你我的心理特質(zhì)的。更進(jìn)一步,如果計(jì)算機(jī)能根據(jù)個人性格特質(zhì)做出匹配性的響應(yīng),那么它就真的成為具有情感和社交能力的智能產(chǎn)物了。
不知道大家是否看過電影《她Her》、《機(jī)械姬Ex Machina》(注:年度科幻電影排名前五),《她》里面基于人工智能虛擬的Dream Girl,絕對是你完美的伴侶。
第五,最后一點(diǎn)也是最為重要的一點(diǎn),好歹我也辛辛苦苦梳理了這么多的資料,看完記得點(diǎn)贊哈。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03