
大數(shù)據(jù)與人才的發(fā)現(xiàn)評價_數(shù)據(jù)分析師考試
目前,對于什么叫大數(shù)據(jù),以及大到什么程度才叫大數(shù)據(jù),數(shù)據(jù)科學家的認識還未統(tǒng)一。有一種意見認為,在不同的領(lǐng)域應(yīng)該有所不同。但是,大數(shù)據(jù)有幾個特征是明顯的:一是“非樣本”而是全部,二是“非結(jié)構(gòu)”且組成復雜,三是時時刻刻變動不息。按照這樣一種精神來觀察人才工作,筆者認為是可以在以下三方面,對人才發(fā)現(xiàn)評價方面有所推進。
篩選發(fā)現(xiàn)人才
全世界每天都有大量學術(shù)論文發(fā)表,因此,把他們集中起來分類錄入就不是一件難事。為了從中選拔出優(yōu)異者,可以讓同行專家投票,也可以采取別的替代方法。于是,美國科學家想到了“科學論文引用率”。就是考察科學論文被他人引用的狀況,又叫作“引用指數(shù)法”。這個方法的產(chǎn)生與持續(xù),確實幫助世界科學界篩選評價出不少杰出科學家,因此風行至今。
海量的論文,到底哪一篇創(chuàng)新性強、學術(shù)影響大?把它找出來,并不是一件容易之事,人們動腦筋把這個問題解決了。論文引用這個事情雖然近期遭到一些詬病,但并非方法本身,而是操作問題。就方法而言,還是科學可行的。
最近,國際知名的湯森路透公司,就是利用這種方法準確篩選而發(fā)現(xiàn)諾貝爾獎花落誰家的。湯森路透的專家說,他們的方法就是憑借大數(shù)據(jù)。只要打開湯森路透公司的網(wǎng)站,你就可以看到不少各種各樣的人才排行榜,分專業(yè)、分行業(yè),分區(qū)域,分國家。
選出各行各業(yè)的優(yōu)秀人才,并且將他們按照一定的規(guī)則排隊,是一件意義重大的事情,是人才工作領(lǐng)導部門的一項基本功。例如,通過它可以幫助我們找到有限資金的資助重點,而不至于“到處撒一些胡椒面”,不僅能夠提升資金的使用效率,而且避免了人情關(guān)系。
湯森路透公司稱,利用大數(shù)據(jù)方法,他們成功預測也就是發(fā)現(xiàn)了去年的8位諾貝爾獎獲得者,準確率高達8/11,也就是72.7%。
比較鎖定人才
在美國,不少人喜歡看棒球。如何組織好一支棒球隊就成為一種學問。比利·比恩是一位棒球隊的經(jīng)理,自然常常思考這個問題。一般經(jīng)理尋找優(yōu)秀球員都依靠獵頭公司,他則不然,他是找來一位統(tǒng)計學家前來幫忙,而且盡量將球員的各種能力數(shù)據(jù)化,并以此作為衡量球員的唯一標準。
可以想到,不同的棒球經(jīng)理對于什么叫“優(yōu)秀”都有自己的獨特理解。比利·比恩則通過他與統(tǒng)計學家共同研制的這套計算機程序和數(shù)學模型,專門尋找那些實際價值被低估了的球員,目的是實現(xiàn)最高的“投入產(chǎn)出比”。這么一來,他做到了以有限的投資,尋找最適宜的人才,終于創(chuàng)下了美國歷史上職業(yè)棒球大聯(lián)盟連勝20場的空前紀錄。
大數(shù)據(jù)專家認為,比利·比恩是靠勝人一籌的人才評價軟件提升了找尋精度,打敗眾獵頭而以智取勝的。可見,就是依靠同一種原理方法,也有評價技術(shù)與思路的高低優(yōu)劣之分。
排序評價人才
大數(shù)據(jù)特別重視事物的相關(guān)性。這種相關(guān),可能距離較遠,也可能距離較近。最近面世的兩本新書《唐詩排行榜》與《宋詞排行榜》,我認為就是利用了大數(shù)據(jù)原理而實現(xiàn)詩歌排行的新嘗試。雖然書名叫作詩詞的排行榜,實際上,也對詩家、詞家做出了排隊。
眾所周知,對于唐詩宋詞,人各有愛。有人喜歡李白的浪漫,有人熱愛杜甫的現(xiàn)實;有人稱贊辛棄疾的豪放慷慨,有人偏愛李清照的婉約多情。也就是說,詩詞界沒有最高法院,不好評論高低上下。但是,從古至今,人們不住地吟誦評論,總有一個名次之分把?于是有人開始采用新的數(shù)學統(tǒng)計方法進行研究,以上兩本專著就是憑借方法創(chuàng)新實現(xiàn)的產(chǎn)品創(chuàng)新。
評價者采用了四個方面的數(shù)據(jù):歷代選本入選唐詩的數(shù)據(jù)、歷代點評唐詩的數(shù)據(jù)、20世紀研究唐詩論文的數(shù)據(jù),以及文學史著作選介唐詩的數(shù)據(jù)。此外,還參考了網(wǎng)絡(luò)連接的唐詩數(shù)據(jù)。數(shù)據(jù)采集后,研究者進行了加權(quán)處理以及標準化處理,通過數(shù)學變換消除各項指標量綱的差異。這么一來,就可以得到一個計算公式,而后通過計算機自動計算出每首詩的綜合得分。這樣,位居前一百名的唐詩名篇就排列出來了。結(jié)果,高居榜首的是崔顥的《黃鶴樓》。第二至第五名分別為王維的《送元二使安西》,王之渙的《涼州詞(黃河遠上)》,王之渙的《登鸛雀樓》,杜甫《登岳陽樓》。前10名內(nèi)出現(xiàn)了柳宗元、孟浩然、常健、王勃、李白的名篇。但是,如果全面仔細觀察,在這100首唐詩之內(nèi),按出現(xiàn)的詩歌篇數(shù)排隊,杜甫、王維和李白高居前三。
這告訴我們,按最負盛名的詩歌排隊,崔浩、王維、王之渙依次排列,但按照最負盛名的詩人排隊,卻成了杜甫、王維、李白遙遙領(lǐng)先。本來是要排行唐詩的,一轉(zhuǎn)身,詩歌創(chuàng)作人才的排行也自然呈現(xiàn)出來了,這是因為二者具有很高的相關(guān)性。我想說的是,這種排序方法,對于各行各業(yè)的人才發(fā)現(xiàn)評價具有相當?shù)膯l(fā)意義。
結(jié)語:人才發(fā)現(xiàn)與評價的方法途徑大致有三:成果鑒定法、同行認可法、大數(shù)據(jù)法。以上我們是從大數(shù)據(jù)思維的角度,對人才發(fā)現(xiàn)評價進行了一些初步探討。限于對大數(shù)據(jù)的理解不夠,很可能沒有把問題講清楚。但是,我們從中能夠感受到的是,運用大數(shù)據(jù)方法發(fā)現(xiàn)評價人才,需要的是三種能力:計算機云計算技術(shù)能力,數(shù)據(jù)收集與挖掘能力,還有實施人才管理能力。三種能力密切配合方能發(fā)揮作用,達到目的。人才發(fā)現(xiàn)與人才評價是既一分為二又合二為一的。只有發(fā)現(xiàn)了人才,才能實施評價,而發(fā)現(xiàn)者又總是具有一定衡量標準的。社會生活實際中,人才是有“潛顯”之分,能夠通過不同方法發(fā)現(xiàn)“潛人才”,才是可貴的真本事。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘龌蚴窃诼殘稣媾R崗位替代、技能更新、人機協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學習提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時代的價值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競爭力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價值的橋梁? 在數(shù)據(jù)驅(qū)動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復雜的數(shù)據(jù),如何高效地進行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11