
為什么人工智能沒有大數(shù)據(jù)就不能生存
隨著技術的發(fā)展和進步,數(shù)據(jù)量呈指數(shù)級增長,這并不令人意外。如果說人們在2005年還可以勉強處理0.1ZB的數(shù)據(jù)的話,那么如今這個數(shù)字已超過了20ZB,甚至到2020年的數(shù)據(jù)量將達到47ZB。除了數(shù)量龐大之外,數(shù)據(jù)面臨的問題還在于其大部分是非結構化的數(shù)據(jù),而這些不完整或不準確的數(shù)據(jù)對于蓬勃發(fā)展的人工智能和人類來說沒有任何好處。
人們?nèi)缃裰荒芴幚?0%的結構化數(shù)據(jù),而剩下的都是大量未被標記的信息,機器不能以建設性的方式使用。例如,電子郵件就是非結構化的數(shù)據(jù),而電子表格等內(nèi)容被認為是被標記的結構化數(shù)據(jù),并且可以被機器成功掃描。
這看起來似乎并不成問題,但如果人們期望人工智能可以更好地應用在醫(yī)療保健,無人駕駛汽車,家庭生活等行業(yè)領域,這就需要擁有整潔有序的數(shù)據(jù)。具有諷刺意味的是,人們已經(jīng)非常擅長創(chuàng)建內(nèi)容和數(shù)據(jù),但還沒有找到一種方法來準確地利用數(shù)據(jù)來滿足人們的需求。
數(shù)據(jù)科學家也在不斷努力
數(shù)據(jù)科學是過去幾年積累了大量數(shù)據(jù)的領域之一,越來越多的數(shù)據(jù)科學家致力于解決這一混亂問題,這是很自然的。然而,最近的一項調(diào)查顯示,與人們的觀點相反,數(shù)據(jù)科學家花費在構建算法和挖掘數(shù)據(jù)模式上的時間少了很多,而是在開展所謂的數(shù)字清理工作,也就是清理和組織數(shù)據(jù)。正如人們所看到的,這些數(shù)據(jù)肯定不利于有著光明未來的人工智能發(fā)展和應用。
人們在預測人工智能的發(fā)展時顯然沒有考慮到這樣一個事實,即雖然機器可以成功替代為模式挖掘數(shù)據(jù)的少數(shù)一些數(shù)據(jù)科學家,但他們可能無法取代絕大多數(shù)致力于研究數(shù)據(jù)的科學家,而他們大部分時間都在收集、清理和組織這些數(shù)據(jù)。當然,最好從一開始就以更加整體的方式收集數(shù)據(jù),而不是分配太多時間和資源來追溯和修復這些數(shù)據(jù)。幸運的是,人工智能領域的領導者已慢慢地達成了這種共識,利用他們的技能和影響力,改變了數(shù)據(jù)科學的走向,并將其與人工智能聯(lián)系起來。
人工智能目前還不能趕超人類
人們都聽說過人工智在某些方面超越人類的報道,例如世界水平最高的圍棋大師被谷歌的AlphaGo人工智能擊敗。然而,這只能說明人工智能可以在小眾的任務中取得驚人的成果,但其總體能力仍然與人類的能力無法匹敵。人工智能根本無法處理很多微妙的、具有邏輯的步驟和措施。
在處理財務申報和法律法規(guī)方面,人工智能的局限性更加明顯。其遇到的問題與其他地方一樣。只要人工智能機器沒有提供結構化數(shù)據(jù),如標準化合同,人工智能就會感到非常困惑。這意味著目前還需要數(shù)據(jù)科學家來解決這個問題。
團隊工作讓人工智能更為有效
高素質(zhì)的數(shù)據(jù)分析師的聘用成本很高,這使得這一領域的進步更加困難。關鍵是要通過采用可簡化流程的技術進行收集和建模。
另一個關鍵方面是多個部門需要共同努力解決大數(shù)據(jù)所帶來的問題。財務和技術專家需要攜手合作,從一開始就正確識別他們收集的數(shù)據(jù)的潛在缺陷。這些專家解決問題的方式也應該進行注冊,以便通過機器成功復制。其目標是創(chuàng)建質(zhì)量保證算法,以確定過去與錯誤相關的模擬結果。人們能夠創(chuàng)建的模型越多,數(shù)據(jù)錯誤和違規(guī)的空間就越小。
沒有大數(shù)據(jù),人工智能無法生存
無論人工智能的發(fā)展方向是什么,也許為人類帶來更多的好處或壞處,但有一點是肯定的:人工智能如果沒有大數(shù)據(jù),終將一事無成。人們已經(jīng)從日常生活中得到了很多例子,這些例子很可能認為是理所當然的,這證明了人工智能存在的必要性。以Cortana或Siri為例,他們能夠理解人們提出的問題和疑問,只是因為他們獲得了無窮無盡的信息,幫助它們理解人們的自然語言。谷歌搜索引擎似乎已經(jīng)成為無所不知的力量,對每個人都非常了解,這是因為人們在其搜索引擎上每天都有大量的日志。為此,企業(yè)也能夠做出準確的報告,例如那些可以使用相關工具識別網(wǎng)站的報告,這歸功于數(shù)據(jù)最初收集的整潔性。
由于人工智能與大數(shù)據(jù)密切相關,因此只有通過清晰的結構化數(shù)據(jù)才能更好地處理這些,從而改善人們的生活。幸運的是,人們正在逐漸了解人工智能發(fā)展背后的需求。這就是為什么人們看到數(shù)據(jù)科學家的工作方式在資金、工資、工具和設備方面有所改進的原因。
這種意識正在全球范圍內(nèi)逐漸普及,使企業(yè)和專家能夠相互合作,以便更有效地收集數(shù)據(jù),建立可進一步幫助機器清潔和構造數(shù)據(jù)的模型,并為未來的發(fā)展奠定基礎。了解人工智能和大數(shù)據(jù)的問題出在哪里,意味著其問題已經(jīng)解決了一半。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03