
CDA數(shù)據(jù)分析研究院出品,轉(zhuǎn)載須授權(quán)
它不再是人工智能研究人員和亞馬遜,谷歌和Netflix等天生的數(shù)字公司的專利。
機器學(xué)習(xí)是基于可以從數(shù)據(jù)中學(xué)習(xí)而不依賴于基于規(guī)則的編程的算法。上世紀90年代末,由于數(shù)字化和廉價的計算能力的穩(wěn)步發(fā)展使數(shù)據(jù)科學(xué)家能夠停止構(gòu)建成品模型,而是訓(xùn)練計算機去這樣做,因此它在20世紀90年代后期成為一門科學(xué)學(xué)科。世界現(xiàn)在正在涌動著大量的無法管理和復(fù)雜的大數(shù)據(jù),這增加了機器學(xué)習(xí)的潛力 - 以及對機器學(xué)習(xí)的需求。
2007年,斯坦福大學(xué)人工智能實驗室負責(zé)人李飛飛放棄了嘗試對計算機進行編程以識別物體的做法,并開始標記孩子三歲之前可能遇到的數(shù)百萬原始圖像貼上標簽并將其輸入到電腦上。通過顯示成千上萬個帶有貓的實例的圖像數(shù)據(jù)集,機器可以形成自己的規(guī)則來決定一組特定的數(shù)字像素集實際上是否是貓。去年11月,李的團隊推出了一個程序,可以高精度地識別任何圖片的視覺元素。IBM的Watson機器依賴于類似的自我評分系統(tǒng),2011年在數(shù)百個潛在的答案中擊敗了世界上最好的Jeopardy節(jié)目中的選手。
盡管這些壯舉令人眼花繚亂的很,但是機器學(xué)習(xí)與人類意義上的學(xué)習(xí)完全不同。但它已經(jīng)做得非常好了 - 而且會變得更好 - 它正在無情地吸收任何數(shù)量的數(shù)據(jù)和變量的各種組合。由于機器學(xué)習(xí)作為主流管理工具的出現(xiàn)相對較晚的,因此它常常引發(fā)一些問題。在這篇文章中,我們提出了一些我們經(jīng)常聽到并以我們希望對任何高管都有用的方式進行回答?,F(xiàn)在是解決這些問題的時候了,因為機器學(xué)習(xí)增加的商業(yè)模式的競爭的重要性正在蓄勢待發(fā)。實際上,管理學(xué)作者拉姆·查蘭(Ram Charan)表示”任何現(xiàn)在不是數(shù)學(xué)家、或者無法成為數(shù)學(xué)家的組織,都已經(jīng)成為了一家傳統(tǒng)的公司?!?/span>
1.傳統(tǒng)行業(yè)如何利用機器學(xué)習(xí)收集新的業(yè)務(wù)見解?
好吧,讓我們從運動開始吧。今年春天,美國國家籃球協(xié)會錦標賽的競爭者依賴于加州機器學(xué)習(xí)初創(chuàng)公司Second Spectrum的分析。通過數(shù)字化過去幾個賽季的比賽,它創(chuàng)造了預(yù)測模型,讓教練能夠區(qū)分,正如首席執(zhí)行官Rajiv Maheswaran所說的那樣,“一個投籃得厲害的射手和一個投籃不好的射手” - 并根據(jù)此進行調(diào)整自己的決策。
再也沒有比通用電氣公司更古老、更傳統(tǒng)的公司了,這是道瓊斯工業(yè)股票平均價格指數(shù)原始股中唯一一家上市119年之后依然健在的公司。通用電氣公司通過處理從深海油井或噴氣發(fā)動機收集的數(shù)據(jù)來優(yōu)化性能、預(yù)測故障和簡化維護工作,從而已經(jīng)賺了數(shù)億美元。但去年年底從IBM軟件中作為軟件研究的副總裁科林·帕里斯加入通用電氣公司后,認為持續(xù)的數(shù)據(jù)處理能力的提高,傳感器和預(yù)測算法的不斷進步將很快使他的公司有同樣的銳利的洞察力,谷歌目前已經(jīng)進入了一個來自西好萊塢的24歲網(wǎng)民的在線行為。
2.北美以外的地方怎么樣?
在歐洲,十幾家銀行用機器學(xué)習(xí)技術(shù)取代了舊的統(tǒng)計建模方法,在某些情況下,新產(chǎn)品的銷售額增長了10%,資本支出節(jié)省了20%,現(xiàn)金收入增加了20%,流失率下降20%。這些銀行通過為零售業(yè)和中小型公司的客戶設(shè)計新的推薦引擎,實現(xiàn)了這些收益。他們還建立了微目標模型,可以更準確地預(yù)測誰將取消貸款服務(wù)或造成貸款違約,以及如何最好地進行干預(yù)。
言歸正傳,正如在最近的麥肯錫季刊中的一篇文章指出,我們的同事一直嘗試將硬分析應(yīng)用到人才管理的軟材料中。去年秋天,他們測試了三種算法的能力,一種有外部供應(yīng)商開發(fā),一種由內(nèi)部構(gòu)建,僅通過檢查掃描的簡歷,就能預(yù)測到該公司將接受的10,000多名潛在的新員工。這些預(yù)測與現(xiàn)實世界的結(jié)果密切相關(guān)。有趣的是,這些機器接受的女性候選人比例略高,這為使用分析來解鎖更多樣化的個人資料和對抗隱藏的人類偏見而帶來了希望。
隨著越來越多的虛擬世界被數(shù)字化,我們通過開發(fā)和測試算法從數(shù)據(jù)中學(xué)習(xí)的能力對于現(xiàn)在被視為傳統(tǒng)業(yè)務(wù)的東西變得更加重要。谷歌首席經(jīng)濟學(xué)家哈爾·瓦里安稱此為“計算機改善。”因為“大規(guī)模生產(chǎn)改變了產(chǎn)品組裝的方式,持續(xù)的改進也改變了制造的方式”他說,“因此,持續(xù)(往往是自動)實驗將改善我們優(yōu)化組織業(yè)務(wù)流程的方式“
3.機器學(xué)習(xí)的早期基礎(chǔ)是什么?
機器學(xué)習(xí)基于許多早期構(gòu)建塊,從經(jīng)典統(tǒng)計開始。統(tǒng)計推斷確實形成了當(dāng)前人工智能實現(xiàn)的重要基礎(chǔ)。但重要的是要認識到,經(jīng)典統(tǒng)計技術(shù)是在18世紀到20世紀初之間發(fā)展起來的,其使用的數(shù)據(jù)集比我們現(xiàn)在使用的數(shù)據(jù)集要小得多。機器學(xué)習(xí)不受預(yù)設(shè)的統(tǒng)計假設(shè)的限制。因此,它可以產(chǎn)生人類分析師自己看不到的洞察力,并以更高的準確度進行預(yù)測。
最近,在20世紀30年代和40年代,計算機的先驅(qū)(例如對人工智能有深刻和持久興趣的艾倫圖靈)開始制定和修補神經(jīng)網(wǎng)絡(luò)等基本技術(shù),使今天的機器學(xué)習(xí)成為可能。但是這些技術(shù)在實驗室中停留的時間比許多技術(shù)都要長,并且在大多數(shù)情況下,必須等待20世紀70年代末和80年代初的強大計算機的開發(fā)和基礎(chǔ)設(shè)施。這可能是機器學(xué)習(xí)采用曲線的起點。引入現(xiàn)代經(jīng)濟的新技術(shù) - 例如蒸汽機,電力,電動機和計算機 - 似乎需要大約80年才能從實驗室過渡到你可能稱之為文化隱形的東西。計算機目前還沒有從人們的視線中消失,但很有可能會在2040年消失,機器學(xué)習(xí)可能很快就退居幕后了。
4.機器學(xué)習(xí)入門需要什么?
如果C級管理人員將機器學(xué)習(xí)視為制定和實施戰(zhàn)略愿景的工具,他們將最好地利用機器學(xué)習(xí)。但這意味著將戰(zhàn)略放在首位。如果沒有戰(zhàn)略作為起點,機器學(xué)習(xí)就有可能成為公司日常運營中被埋沒的工具:它將提供有用的服務(wù),但其長期價值可能僅限于無休止地重復(fù)“千篇一律”應(yīng)用,如模型獲取,激勵和客戶留存的模型。
我們發(fā)現(xiàn),這與并購有相似之處并且具有指導(dǎo)意義。畢竟,這是一個明確定義的手段。沒有明智的企業(yè)會匆忙的進行一連串的收購或合并,然后只是坐下來看看會發(fā)生什么。從事機器學(xué)習(xí)的公司應(yīng)該在進行并購之前做出公司所做的三項承諾。首先,這些承諾是調(diào)查所有可行的替代方案; 第二,全心全意地在高管層面推行這一戰(zhàn)略; 第三,使用(或必要時獲得)高級管理人員的現(xiàn)有專業(yè)知識和知識來指導(dǎo)該戰(zhàn)略的應(yīng)用。
負責(zé)創(chuàng)建戰(zhàn)略愿景的人很可能(或曾經(jīng))是數(shù)據(jù)科學(xué)家。但是,當(dāng)他們確定問題和戰(zhàn)略的預(yù)期結(jié)果時,他們需要C級同事的指導(dǎo),監(jiān)督其他關(guān)鍵的戰(zhàn)略計劃。更廣泛地說,公司必須有兩種類型的人才能釋放機器學(xué)習(xí)的潛力。“定量分析師”學(xué)習(xí)其語言和方法?!胺g人員”可以通過將定量分析師的復(fù)雜結(jié)果重新定義為管理者可以執(zhí)行的可操作的見解,從而在數(shù)據(jù)、機器學(xué)習(xí)和決策制定學(xué)科之間架起橋梁。
有效的機器學(xué)習(xí)需要獲得大量有用和可靠的數(shù)據(jù),例如Watson在測試中能夠比醫(yī)生更好地預(yù)測腫瘤學(xué)結(jié)果,或Facebook最近成功地教會計算機,以便像人類一樣準確地識別特定的人臉。真正的數(shù)據(jù)戰(zhàn)略始于識別數(shù)據(jù)中的差距,確定填補這些差距所需的時間和資金,以及打破數(shù)據(jù)孤島。很多時候,各部門都在囤積數(shù)據(jù),并將獲取信息的途徑政治化- 這是一些公司創(chuàng)建首席數(shù)據(jù)官這個新角色來整合所需要的信息的原因之一。其他要素包括將生成數(shù)據(jù)的責(zé)任交給一線的管理人員。
從小初招收,尋找更容易摘到的果實,并宣傳任何早期的成功。這將有助于招募基層支持,并加強個人行為和員工參與的變化,最終決定組織是否可以有效地應(yīng)用機器學(xué)習(xí)。最后,根據(jù)明確的成功標準進行評估結(jié)果。
5.高層管理人員的作用是什么?
行為改變至關(guān)重要,高層管理人員的關(guān)鍵角色之一就是影響和鼓勵這種改變。例如,傳統(tǒng)管理人員必須適應(yīng)對自己的A / B測試方面的變化,這是數(shù)字公司使用的技術(shù),用于了解對在線消費者有吸引力的內(nèi)容或者說無法吸引消費者的內(nèi)容。擁有越來越強大的計算機洞察力的一線管理人員必須學(xué)會自己做出更多決策,高層管理人員設(shè)定總體方向,只有在出現(xiàn)時才會進行關(guān)注。將分析的使用民主化 - 為一線提供必要的技能并設(shè)置適當(dāng)?shù)募畲胧┮怨膭顢?shù)據(jù)共享 - 而這需要時間。
C級官員應(yīng)該分三個階段考慮應(yīng)用機器學(xué)習(xí):機器學(xué)習(xí)1.0,2.0和3.0 - 或者,我們更喜歡說,描述,預(yù)測和處理。他們可能不需要擔(dān)心大多數(shù)公司已經(jīng)完成的描述階段。這完全是為了收集數(shù)據(jù)庫中的數(shù)據(jù)(必須為此目的而發(fā)明),這一發(fā)展為管理者提供了對過去的新見解。OLAP-在線分析處理 - 現(xiàn)在已經(jīng)非常常規(guī),并且在大多數(shù)大型組織中已經(jīng)建立。
現(xiàn)在更迫切的是要進入預(yù)測階段,而這個階段也正在發(fā)生。今天的尖端技術(shù)已經(jīng)使企業(yè)不僅可以查看其歷史數(shù)據(jù),還可以預(yù)測未來的行為或結(jié)果 - 例如,通過幫助銀行的信用風(fēng)險官員評估哪些客戶最有可能違約或啟用電信公司預(yù)計哪些客戶在短期內(nèi)特別容易“流失”(展覽)。
高級管理層在開始預(yù)測階段時經(jīng)常關(guān)注的是數(shù)據(jù)的質(zhì)量。這種擔(dān)憂經(jīng)常使高管癱瘓。然而,根據(jù)我們的經(jīng)驗,過去十年的IT投資為大多數(shù)公司提供了足夠的信息,以便從不完整的,凌亂的數(shù)據(jù)集中獲得新的見解,當(dāng)然前提是這些公司選擇了正確的算法。與現(xiàn)有數(shù)據(jù)倉庫中開采的數(shù)據(jù)源相比,添加外來的新數(shù)據(jù)源可能只會帶來很少的好處。面對這一挑戰(zhàn)是“首席數(shù)據(jù)科學(xué)家”的任務(wù)。
處理 - 機器學(xué)習(xí)的第三個也是最先進的階段 - 是未來的機會,因此必須引起高層的高度重視。畢竟,僅僅預(yù)測客戶將會做什么是不夠的; 只有理解為什么他們打算這樣做,公司才能鼓勵或阻止未來的行為。從技術(shù)上講,今天的機器學(xué)習(xí)算法,在人工翻譯的幫助下,已經(jīng)可以做到這一點。例如,一家關(guān)注其零售業(yè)務(wù)違約規(guī)模的國際銀行最近確定了一組客戶,他們在突然從白天使用信用卡轉(zhuǎn)為在半夜使用信用卡。這種模式伴隨著儲蓄率急劇下降。在咨詢了分行經(jīng)理之后,銀行進一步發(fā)現(xiàn),以這種方式行事的人們也在應(yīng)對最近的一些壓力事件。因此,所有被算法標記為該微觀成員的客戶都會自動獲得信用卡的新限制并提供財務(wù)建議。
機器學(xué)習(xí)的處理階段,開創(chuàng)了人機協(xié)作的新時代,需要我們工作方式的最大變化。雖然機器識別模式時,人工翻譯人員的責(zé)任是將其解釋為不同的微段解釋模式,并建議相應(yīng)的操作過程。在這里,高管必須直接參與設(shè)計和指定這些算法試圖優(yōu)化的目標。
6.從長遠來看,這聽起來像是自動化取代了人類。我們是否更接近于知道機器是否會取代管理人員?
確實,變革到來的如此之快(數(shù)據(jù)生成也是如此之快),以至于人與人之間的所有決策參與正在迅速變得不切實際。展望三到五年,我們期望看到更高水平的人工智能,以及分布式自治公司的發(fā)展。這些自我激勵,自成體系的代理人以公司的形式組成,將能夠自主地實現(xiàn)既定目標,而無需任何直接的人為監(jiān)督。一些DAC肯定會成為自編程。
一種觀點認為分布式自治公司對我們的文化具有威脅性和敵意。但是當(dāng)它們完全發(fā)展的時候,機器學(xué)習(xí)將在文化上變得隱形,就像20世紀的技術(shù)發(fā)明消失在當(dāng)前的文化背景中一樣。人類的角色將是指導(dǎo)和指導(dǎo)算法,當(dāng)它們實現(xiàn)給定的目標時。這也是在2008年金融危機期間造成這種損害的自動交易算法的一個教訓(xùn)
無論計算機發(fā)現(xiàn)什么新的見解,只有人力資源管理者才能決定基本問題,例如公司真正想要解決的關(guān)鍵業(yè)務(wù)問題。正如人類同事需要定期審查和評估一樣,這些“精彩的機器”及其作品也需要定期評估,改進,甚至可能被解雇或被告知要走跟之前完全不同的道路- 這需要有經(jīng)驗,判斷和領(lǐng)域?qū)I(yè)知識的高管。
獲勝者既不是機器,也不是人類,而是兩者有效地合作。
7.所以從長遠來看,沒有必要擔(dān)心?
很難確定,但分布式自治公司和機器學(xué)習(xí)應(yīng)該在高級管理層議程中占據(jù)重要位置。我們期待有一個,關(guān)于什么是智能、人工智能或其他智能的討論將會結(jié)束,因為不存在智能這種東西,它只是人類發(fā)展的一個過程。如果分布式自治公司能過智能地行動,智能地執(zhí)行并且智能地響應(yīng),我們將停止爭論是否存在除人類之外的高級智能。與此同時,我們都必須考慮我們希望這些實體做什么,我們希望它們的行為方式,以及我們?nèi)绾闻c它們合作。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10