
回顧與展望丨數(shù)據(jù)科學 機器學習:2017年的主要發(fā)展和2018年的關鍵趨勢
KDnuggets邀請了數(shù)據(jù)科學相關領域杰出的代表人物對2017年的主要發(fā)展和2018年的趨勢進行了總結和預測。主要內(nèi)容涉及到 AI 、深度學習、機器學習、安全、AlphaGo Zero等等。
Kirk D. Borne
BoozAllen的首席數(shù)據(jù)科學家,天體物理學博士。數(shù)據(jù)科學和大數(shù)據(jù)領域的影響者。
回顧 2017
在2017年,技術成熟度曲線(Technology Hype Cycle)的中心位置由原來的大數(shù)據(jù)漸漸被 AI 取代。媒體和從業(yè)者對 AI 的關注在正面新聞,比如越來越強大的機器學習算法和 AI 在汽車、醫(yī)療影像、金融服務等行業(yè)的應用;以及負面新聞,關于機器將搶走人類工作的威脅。
我們還見證了數(shù)據(jù)方面創(chuàng)新的發(fā)展,包括更多地使用API,即服務提供、數(shù)據(jù)科學平臺、深度學習,以及云機器學習服務。大數(shù)據(jù)、機器學習和 AI 的專業(yè)應用,包括機器智能、規(guī)范性分析、行為分析和物聯(lián)網(wǎng)。
展望 2018
在2018年,我們還需要關注 AI 的其他方面。比如 AI 的價值,衡量它的投資回報率,讓其可以實際操作。
主要的發(fā)展領域與2017年沒有太大差別,主要包括過程自動化、機器智能、客戶服務。我們還將見證物聯(lián)網(wǎng)的日益成熟,包括更強大的安全特性、模塊化平臺、傳感器數(shù)據(jù)流的AP等。在2018年,更多的從業(yè)人員將面對挑戰(zhàn),向持懷疑態(tài)度的公眾傳達 AI 的好處。
Tom Davenport
巴布森學院信息技術與管理專業(yè)的杰出教授,國際分析研究所聯(lián)合創(chuàng)始人,麻省理工學院數(shù)字經(jīng)濟學的研究員,德勤分析的高級顧問。
回顧 2017
企業(yè) AI 成為主流,許多大型的知名公司正在進行 AI 或機器學習。一些公司擁有超過50個用到各種技術的項目。大型供應商開始轉(zhuǎn)為開源、自己動手的項目類型。當然,這意味著公司必須提高其數(shù)據(jù)科學技能。
機器學習應用到數(shù)據(jù)集成,數(shù)據(jù)分析和數(shù)據(jù)管理中之前存在的挑戰(zhàn)現(xiàn)在能通過機器學習解決。通過勞動密集型方法對數(shù)據(jù)進行集成和管理正在被替換,至少是通過不同數(shù)據(jù)庫中相似數(shù)據(jù)元素的“概率匹配”來實現(xiàn)的。這能夠減少整合數(shù)據(jù)的時間。
開放源代碼的企業(yè)接受開源,傳統(tǒng)的銀行、保險和醫(yī)療等行業(yè),正在積極地接受開源分析、 AI 和數(shù)據(jù)管理軟件。
展望 2018
我們已經(jīng)進入了“后算法”時代。之前分析師和數(shù)據(jù)科學家需要一定的知識來確定使用哪種算法。但是,分析和機器學習過程的自動化能夠思考100種以上的不同算法。重要的是模型的效果和整體表現(xiàn)。
獨立的 AI 創(chuàng)業(yè)公司的吸引力開始減弱。在風險投資基金的推動下,過去幾年中成立了數(shù)百家 AI 創(chuàng)業(yè)公司。當中大多數(shù)解決的是較小的問題。然而,即使能夠有效地運作,能夠與現(xiàn)有流程和系統(tǒng)集成是其主要挑戰(zhàn)。因此,成熟的企業(yè)更傾向于開發(fā)自己的 AI “微服務”,這些服務相對更容易集成,或者從那些將 AI 嵌入到交易系統(tǒng)的供應商購買。
Jill Dyche
SAS Best Practice的副總裁,暢銷商業(yè)書籍的作者。
回顧 2017
如今幾乎每個人都會應用到 AI 和機器學習。2017年,許多供應商都在開發(fā)自己的 AI 產(chǎn)品。
展望 2018
在2018年,商業(yè)對話和案例中,AI/ML方面會顯著增長。這是因為企業(yè)有許多業(yè)務問題需要解決,管理者不關心神經(jīng)網(wǎng)絡是否要處理稀疏的數(shù)據(jù);對自然語言處理中的詞匯推理挑戰(zhàn)。相反,他們想要加速供應鏈,知道客戶下一步想做什么,然后簡單地告訴電腦他們想要什么。這是一種規(guī)范性分析,那些能夠以簡便的方式解決該問題的供應商能夠笑到最后。
Carla Gentry
Analytical Solution的數(shù)據(jù)科學家
回顧 2017
2017年,每個人都開始討論機器學習、AI 和預測分析。但實際上許多這些公司,供應商只是熱衷于這些熱詞,而并沒有他們宣稱的相關背景。在這些領域的經(jīng)驗需要時間和才干,而不僅僅是盲目的呼吁行動。總之,經(jīng)驗才是最重要的!
展望 2018
2018年,我們需要關注數(shù)據(jù)科學和預測分析的領導者。不是因為這很熱門,而是因為這能給你的企業(yè)帶來巨大的變化。
對招聘進行預測可以節(jié)省數(shù)百萬人的成本;AI 和機器學習可以在幾秒鐘內(nèi)完成你需要幾天去做的事情。技術可以把我們提升到新的高度,但作為數(shù)據(jù)科學家,需要通過法律和社會的基本道德。
Bob E. Hayes
研究人員,作家,Business Over Broadway的出版商,組織心理學博士。
回顧 2017
數(shù)據(jù)科學和機器學習越來越多地應用于各種行業(yè)和領域。在2017年,我們目睹了 AI 的巨大進步。雖然之前深度學習模型需要大量的數(shù)據(jù)教算法,但是神經(jīng)網(wǎng)絡和強化學習表明,創(chuàng)建高性能的算法時并不需要數(shù)據(jù)集。DeepMind采用了這些技術,開發(fā)了Alpha Go Zero,這更優(yōu)于之前版本的算法。
展望 2018
隨著 AI 在刑事司法、金融、教育等領域的持續(xù)發(fā)展,我們將需要建立算法標準,用來評估其不準確性和偏差。包括建立 AI 的使用規(guī)則(例如,避免決策中的暗箱操作),并理解深度學習算法如何做出決定。
數(shù)據(jù)中心的安全漏洞將繼續(xù)攀升,即使互聯(lián)網(wǎng)時代出現(xiàn)的公司(例如imgur, Uber)。因此,我們將看到安全措施方面的改革的,將增加區(qū)塊鏈的可見性作為一種可行的方式,用來改善公司如何獲得其選區(qū)的數(shù)據(jù)。
Gregory Piatetsky-Shapiro
KDnuggets總裁,數(shù)據(jù)科學家,KDD和SIGKDD會議(知識發(fā)現(xiàn)和數(shù)據(jù)挖掘專業(yè)組織)的聯(lián)合創(chuàng)始人。
回顧 2017
·AlphaGo Zero可能是2017年 AI 最重要的研究進展。
· 數(shù)據(jù)科學方面自動化的增長,提供了更多提供自動化工具的機器學習平臺。
· AI 的輿論熱度和期望的增長甚至比 AI 和深度學習的發(fā)展還快。
展望 2018
· GDPR(歐洲通用數(shù)據(jù)保護條例)將在2018年5月25日生效,這將對數(shù)據(jù)科學產(chǎn)生重大影響,其中包括解釋的權利(你的深度學習方法是否可以解釋為什么某人被拒絕貸款等),以及防止偏見和歧視。
· 谷歌 DeepMind 團隊將跟進AlphaGo Zero的驚人結果,并實現(xiàn)另一個強大的性能。在幾年前,許多人認為這是計算機無法做到的。
(注: DeepMind 取得的另一個突破進展發(fā)生在2017年12月,AlphaZero在4個小時內(nèi)就能熟練掌握國際象棋,同樣的自我博弈學習程序可以在國際象棋、圍棋和日本將棋方面達到超人般的表現(xiàn)。)
·我們將會看到更多的自動駕駛汽車的發(fā)展,包括首次出現(xiàn)的問題正在被解決(比如拉斯維加斯的無人駕駛飛機,一開始不知道如何讓道,但之后能夠讓道)。
· AI 的泡沫將繼續(xù)存在,但我們將看到重組和整合的跡象。
Paul Gearan,Heather Allen,Karl Rexer
Rexer Analytics的負責人,Rexer Analytics是一家數(shù)據(jù)挖掘和高級分析咨詢公司。
回顧 2017
對于沒有研究或分析背景的人群,使用商業(yè)智能軟件仍然面臨許多障礙。當然出現(xiàn)了Tableau、IBM Watson、Microsoft Power BI等軟件。然而,根據(jù)Rexer Analytics在2017年收集的數(shù)據(jù),只有近一半的受訪者表示,除了數(shù)據(jù)科學團隊,他們公司其他員工也有使用相關自助工具。工具使用時,常見的問題有難以理解分析過程以及對分析結果的誤解。
展望 2018
對于2018年,實現(xiàn)推廣數(shù)據(jù)科學工具的目標是擴大分析的使用范圍,從而得出有效的結果,這是至關重要的。通常情況下,向非數(shù)據(jù)分析方面的員工和管理人員提供工具,讓他們對自己的假設進行探索和可視化是很重要的。但同樣重要的是,團隊要與數(shù)據(jù)科學專業(yè)人員一起開發(fā)模型并解讀得出的見解,這些專業(yè)人員經(jīng)過培訓,能夠掌握特定分析技術的應用。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03