
大數(shù)據(jù)為何有識才慧眼
前幾年,美國麻省理工學(xué)院的幾位人類行為動力學(xué)家將多個傳感器組合成一個綜合識別器。最初的樣子就像一個灰色的盒子,里面裝配著一個紅外線收發(fā)器,一個麥克風(fēng)和兩個加速度傳感器。有平裝書大小,可以掛在胸前。這個綜合傳感器,可以將一個人講話的最重要的信號,例如講話的時間、當(dāng)時的情緒、身體的各種反應(yīng)記錄下來,由此可以預(yù)測未來行動之趨勢、發(fā)展之結(jié)果。
研究人員把這個“魔盒”帶到了電視臺“5分鐘相親”節(jié)目。參與節(jié)目的女性坐成一排,男性則每5分鐘換一次位置,與之相互交談、認(rèn)識。根據(jù)雙方交談,“魔盒”能夠預(yù)測他們二者是否合得來,能否繼續(xù)交往下去,以后是否會進一步約會。男女雙方交談的過程,無疑會釋放出不少社交信號的。但是,研究人員并不關(guān)注雙方的言談內(nèi)容,而是讓“魔盒”記錄下雙方非常微弱而又微妙的變化:包括聲調(diào)的微弱變化,眉毛是否突然上揚,語速快慢以及有無插話等。這些都是人們無意識的動作,但是卻暴露出了談話雙方的真實思想與情感。
通過反復(fù)實驗,科學(xué)家發(fā)現(xiàn),無須知道雙方談話內(nèi)容,只憑這些獲取的數(shù)據(jù),就可以預(yù)測雙方未來的情感發(fā)展結(jié)果。準(zhǔn)確率達到85%。
現(xiàn)在,這種傳感器已經(jīng)做成了一個徽章大小,可以佩戴在身上?;照鲁潆娨淮?,可以持續(xù)40個小時搜集數(shù)據(jù)。徽章內(nèi)置了數(shù)據(jù)分析算法。佩戴者一年的數(shù)據(jù)都可以存儲在內(nèi),通過這個徽章,員工可以了解自己和組織的互動關(guān)系,管理者可以了解員工的舉止言行,對員工工作進行指導(dǎo)。
計算機到底捕捉了什么
讓我們再來看這樣一幅畫面——
某人打開視頻網(wǎng)站,正在觀看一則廣告,禁不住流露出驚喜的表情。這時,計算機的攝像頭提示燈忽然閃了閃,這是什么意思?原來計算機是在做這樣的事:對準(zhǔn)那個人的眼睛定位,尋找嘴部水平中心線,xyz軸建模,測量他的眼輪匝肌、皺眉肌、顴大肌各塊肌肉的位移,數(shù)據(jù)傳回,數(shù)據(jù)庫表情匹配。
通過這樣的面部識別技術(shù),是對這個人進行觀察判斷,準(zhǔn)確率可達到96.9%。對于更為復(fù)雜的復(fù)合情緒識別率能達到76.9%。有家美國公司就專門為顧客提供情緒反應(yīng)數(shù)據(jù)。此方法還可以用來進行表情測謊。原理是:人們進行虛假或真實的感情表達時,使用的大腦映射不同,反映在面部肌肉動作上也有不同。人類很難區(qū)分的細(xì)微感情變化,計算機卻很容易。
從面部特征識別到表情識別,再在到情緒識別,計算機利用大數(shù)據(jù)能夠辨別真實與謊言。
上海有位大學(xué)生利用商場試衣間,對準(zhǔn)“試衣鏡”映照出來的各式各樣的顧客表情和體勢,開發(fā)了一個軟件,能夠幫助老板預(yù)判顧客喜歡不喜歡這件正在試穿的商品,以利導(dǎo)購員對顧客講一些怎樣的話,他或她就會愿意購買這件商品。
人類千分之一秒的表情,倏忽而過。但是,計算機卻能夠迅即捕捉,做出判斷,幫助人們決策。
還有伯樂的本事呢
看完上面的案例,你可能會認(rèn)為基于大數(shù)據(jù)的識人本領(lǐng),講白了就是“以微知著”,拿“千分之一秒”做文章。其實,大數(shù)據(jù)還有別的本事呢?,F(xiàn)在就再舉一例。
大家都知道,我們每個用人單位都保存著員工的人事檔案。目前,檔案里記錄的不過是員工的一些自然信息、能力信息、履歷信息等,比較簡單。如果我們建立一個大數(shù)據(jù)平臺,就可以以這些信息為基礎(chǔ),進一步擴大搜集范圍,例如將員工留在社交平臺、瀏覽網(wǎng)站上的數(shù)據(jù)擷取過來,那就能立刻使他的相關(guān)信息豐富起來。
在四川成都,有一位年輕的大數(shù)據(jù)科學(xué)家,建立了基于大數(shù)據(jù)的“人才雷達”,能夠從九個不同的維度,把一個人的相關(guān)數(shù)據(jù)擷取過來,使之豐富化、形象化、個體化。例如,你的“學(xué)術(shù)水準(zhǔn)”,大概是從你的學(xué)術(shù)論文發(fā)表數(shù)量與被引用指數(shù)那里獲取的;你的“社會活躍程度”,大概是從你出席國內(nèi)外論壇次數(shù)那里獲得的;你的“閱讀領(lǐng)域”,大概是從你的購書記錄與瀏覽網(wǎng)頁那里獲得的:你的“交往對象”,大概是從你的朋友圈那里獲得的;你的“發(fā)展?jié)摿Α?,大概是從你近五年發(fā)表論文的影響力那里獲得的:你的“生活習(xí)慣”,大概是從你的手機、計算機開關(guān)時間那里獲得的……這樣,大數(shù)據(jù)就能夠從四面八方為你或其他任何人畫出一幅形象逼真的“素描圖”。據(jù)報道,現(xiàn)在有的電商已經(jīng)掌握了每個顧客的一萬多個“標(biāo)簽”,就是一萬多個特征標(biāo)志。只要法律允許,畫出一張你自己也不知道的“素描圖”,應(yīng)該不是難事。
人們只能長嘆一聲:“大數(shù)據(jù)已經(jīng)煉就了火眼金睛!”
由此不難理解,哪個部門或組織若要尋訪人才,依靠大數(shù)據(jù),是一個相當(dāng)不錯的渠道。
中國人推崇“伯樂相馬”。在今天這個大數(shù)據(jù)時代,除了有才愛才的個體伯樂和強調(diào)公平的制度伯樂外,還有了身手不凡的“大數(shù)據(jù)伯樂”。三種伯樂各有各的長處,三方結(jié)合在一起,必能收“放大增強”之效。
有志于引才的部門與單位,大家何樂而不為呢!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11