
關(guān)于 AI 丨不知道這些概念你就落伍了
對所有事情都有一定了比擁有一項專業(yè)技能更實用。對于進(jìn)入新興市場領(lǐng)域的人來說尤其如此,特別是科技領(lǐng)域。
許多人認(rèn)為他們對 AI 有一些了解。但是這個領(lǐng)域很新,而且在飛速發(fā)展,專家們每天都在開拓新領(lǐng)域。
這就是本文的切入點。我希望通過簡短易懂的語言,讓有科技頭腦的人群快速熟悉 AI 術(shù)語、語言和技術(shù)。同時希望許多非該領(lǐng)域的人群能夠讀懂本文,并作為參考。
AI 是什么 ?
人工智能(Artificial intelligence),深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)是用來描述強大的機器學(xué)習(xí)技術(shù)的術(shù)語,這些技術(shù)可以解決許多現(xiàn)實世界的問題。
盡管演繹推理,推理和決策與人腦相比還有一段距離,但 AI 技術(shù)和相關(guān)算法已有許多最新進(jìn)展。AI 可以從中學(xué)習(xí)的大型數(shù)據(jù)集也越來越多。
AI 領(lǐng)域涉及到數(shù)學(xué)、統(tǒng)計學(xué)、概率論、物理學(xué)、信號處理、機器學(xué)習(xí)、計算機科學(xué)、心理學(xué)、語言學(xué)和神經(jīng)科學(xué)等領(lǐng)域。圍繞 AI 的社會責(zé)任和道德問題與許多哲學(xué)問題有相似之處。
進(jìn)一步推進(jìn) AI 技術(shù)的動機是,解決許多變量問題所需的解決方案非常復(fù)雜,難以理解且不容易手動完成。
越來越多的公司、研究人員和個人都依靠機器學(xué)習(xí)來解決問題,而不需要全面的編程指導(dǎo)。程序員發(fā)現(xiàn)編寫模型和解決數(shù)據(jù)問題所需的算法越來越復(fù)雜和耗時。即使當(dāng)我們形成有用的模式來處理大數(shù)據(jù)集時,這往往是非常復(fù)雜,難以維護(hù)并且不能充分測試。
現(xiàn)代機器學(xué)習(xí)和人工智能算法,以及訓(xùn)練數(shù)據(jù)都能夠為我們編程。
智能是什么?
智能(Intelligence):能夠感知信息,并將其作為知識應(yīng)用于環(huán)境中的適應(yīng)性行為。
以上維基百科對智能的定義可以適用于大腦和機器。智能并不意味著意識,這是科幻小說家普遍存在的誤解。
在網(wǎng)上搜索 AI 的例子,你會看到 IBM 的 Watson。這是一種機器學(xué)習(xí)算法,由于在2011年在電視問答節(jié)目《危險邊緣》中獲勝而出名。此后,它被重新定位,并被用作各種商業(yè)應(yīng)用的模板。蘋果,亞馬遜和谷歌正努力在我們的家庭和手機中構(gòu)建類似的系統(tǒng)。
自然語言處理和語音識別是機器學(xué)習(xí)的第一個商業(yè)應(yīng)用。之后實現(xiàn)了許多其他自動識別任務(wù)(模式、文本、音頻、圖像、視頻、面部等)。應(yīng)用范圍正在飛速增長,包括自動駕駛汽車、醫(yī)療診斷、游戲、搜索引擎、垃圾郵件過濾、打擊犯罪、市場營銷、機器人技術(shù)、遙感技術(shù)、計算機視覺、交通、音樂識別、分類等方面。
AI 已經(jīng)深入到我們所使用的技術(shù)中,現(xiàn)在許多人并不將其視為”人工智能”,而只是計算的延伸。如果上街采訪詢問行人他們手機上是否有AI,他們可能會說不。但是 AI 算法已經(jīng)嵌入了各個領(lǐng)域,從預(yù)測文本到相機中的自動對焦系統(tǒng)。人們通常認(rèn)為 AI 時代尚未到來,但實際上我們已處于 AI 時代,而且已經(jīng)有一段時間了。
AI 是一個相當(dāng)普遍的術(shù)語。大多數(shù)研究的重點是人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)這類較狹窄的領(lǐng)域。
人腦如何工作
人腦是一個精密的碳計算機,估計每秒執(zhí)行一百萬兆次計算,消耗約20瓦的功率。中國的超級計算機天河二號(截止到本文是目前世界上最快的超級計算機)每秒只能計算33.86 千萬億次計算,消耗1760萬瓦。顯然機器要像媲美人腦還有一段路要走。
大腦用于進(jìn)行思維的確切機制需要辯論和深入研究。然而,內(nèi)部運行原理往往圍繞神經(jīng)元和其構(gòu)成的網(wǎng)絡(luò)。大腦約包含1000億個神經(jīng)元。
神經(jīng)元之間的相互作用和溝通能夠傳遞信息。在激活其他神經(jīng)元之前,單個神經(jīng)元的信號被進(jìn)行加權(quán)和合并。消息傳遞、結(jié)合、激活其他神經(jīng)元的過程是跨層重復(fù)的。在人腦的1000億個神經(jīng)元中,整體的信息加權(quán)是非常復(fù)雜的。
每個神經(jīng)元在將功能或變化應(yīng)用于加權(quán)輸入前,會先測試是否達(dá)到在激活閾值。這些因素加起來可能是線性或非線性的。
初始輸入信號來自各種來源......我們的感官、身體機能的內(nèi)部監(jiān)測(血氧水平,胃內(nèi)容物等)。在決定如何反應(yīng)之前,單個神經(jīng)元可能會接收到數(shù)十萬個輸入信號。
思考或處理給肌肉的結(jié)果指令是輸入信號和反饋在神經(jīng)網(wǎng)絡(luò)中經(jīng)過多層和多個周期處理的總和。但大腦的神經(jīng)網(wǎng)絡(luò)也在發(fā)生變化和更新,包括神經(jīng)元間權(quán)重的調(diào)整。這是由學(xué)習(xí)和經(jīng)驗造成的。
人類大腦的模型被用作模板在計算機仿真環(huán)境下復(fù)制大腦,即人工神經(jīng)網(wǎng)絡(luò)。
人工神經(jīng)網(wǎng)絡(luò)(ANNs)
人工神經(jīng)網(wǎng)絡(luò)是受到生物神經(jīng)網(wǎng)絡(luò)啟發(fā)的模擬數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)能夠?qū)斎牒洼敵鲋g的非線性關(guān)系進(jìn)行建模和處理。人工神經(jīng)元之間的權(quán)重通過學(xué)習(xí)算法進(jìn)行調(diào)整,該算法能夠讀取觀測數(shù)據(jù),并以提高輸出為目標(biāo)。
使用優(yōu)化技術(shù)讓人工神經(jīng)網(wǎng)絡(luò)解決方案盡可能接近最佳解決方案。如果優(yōu)化成功,人工神經(jīng)網(wǎng)絡(luò)能夠以高性能解決特定問題。
人工神經(jīng)網(wǎng)絡(luò)建模時使用到神經(jīng)元層。這些層的結(jié)構(gòu)被稱為模型的結(jié)構(gòu)。神經(jīng)元是獨立的計算單元,能夠接收輸入并應(yīng)用數(shù)學(xué)函數(shù)來確定消息是否能傳遞。
在簡單的三層模型中,第一層是輸入層,接下來是隱藏層和輸出層。每層可以包含一個或多個神經(jīng)元。
隨著模型變得越來越復(fù)雜,需要更多的層和更多的神經(jīng)元,解決問題的能力也隨之增加。但是如果模型對于給出的問題來說太大了,那么模型不能被有效地優(yōu)化。這被稱為過擬合。
基本的模型結(jié)構(gòu)和調(diào)整是人工神經(jīng)網(wǎng)絡(luò)技術(shù)的主要元素,同時還包括讀取數(shù)據(jù)的學(xué)習(xí)算法。所有部分都具備模型的性能。
模型具有激活函數(shù)的特征。這用于將神經(jīng)元的加權(quán)輸入轉(zhuǎn)換為輸出激活。有一些轉(zhuǎn)換可用作激活函數(shù)。
人工神經(jīng)網(wǎng)絡(luò)非常強大。即使少數(shù)神經(jīng)元中的數(shù)學(xué)很簡單,整個網(wǎng)絡(luò)也會變得復(fù)雜。由于人工神經(jīng)網(wǎng)絡(luò)被認(rèn)為是“黑盒”算法。選擇人工神經(jīng)網(wǎng)絡(luò)作為解決問題的工具應(yīng)該小心,因為之后無法取消系統(tǒng)的決策過程。
深度學(xué)習(xí)是用來描述消耗原始數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)和相關(guān)算法的術(shù)語。數(shù)據(jù)通過模型層進(jìn)行處理,目標(biāo)是計算輸出。
無監(jiān)督學(xué)習(xí)是深度學(xué)習(xí)技術(shù)的卓越之處。正確配置的人工神經(jīng)網(wǎng)絡(luò)能夠自動識別輸入數(shù)據(jù)的重要特征,從而得出期望的輸出。傳統(tǒng)意義上,理解輸入數(shù)據(jù)的重任通常落在構(gòu)建系統(tǒng)的程序員身上。然而,在深度學(xué)習(xí)設(shè)置中,模型本身可以識別如何解釋數(shù)據(jù),從而獲得有意義的結(jié)果。一旦優(yōu)化的系統(tǒng)進(jìn)行訓(xùn)練,模型的計算、內(nèi)存和功耗要求就會大大降低。
簡而言之,特征學(xué)習(xí)算法讓機器使用合適的數(shù)據(jù)學(xué)習(xí)特定任務(wù),即算法學(xué)習(xí)如何學(xué)習(xí)。
深度學(xué)習(xí)應(yīng)用于各種各樣的任務(wù),這被認(rèn)為是創(chuàng)新的 AI 技術(shù)之一。其中有用于監(jiān)督、無監(jiān)督和半監(jiān)督學(xué)習(xí)問題的算法。
陰影學(xué)習(xí)用于描述更簡單的深度學(xué)習(xí)形式,其中數(shù)據(jù)的特征選擇需要程序員進(jìn)行預(yù)先處理和更深入的知識。由此產(chǎn)生的模型更加透明和性能更高,但會增加設(shè)計階段的時間。
結(jié)語
AI 是強大的數(shù)據(jù)處理領(lǐng)域,能夠比程序員開發(fā)的傳統(tǒng)算法更快地得出復(fù)雜的結(jié)果。人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)可以解決多種難題。缺點是創(chuàng)建的優(yōu)化模型不能被取消。這可能會導(dǎo)致道德問題,因為數(shù)據(jù)透明是很重要的。
原文鏈接:
https://medium.com/@AdamTemper/ai-for-dinosaurs-67848a90fce3
如何學(xué)習(xí)AI
人工智能的發(fā)展離不開人才的培育,而CDA數(shù)據(jù)分析師作為行業(yè)的領(lǐng)頭羊,將從各個應(yīng)用場景入手,用實際案例教學(xué)來使CDA人工智能工程師就業(yè)班課程更能符合行業(yè)要求。
掃描二維碼,報名CDA人工智能工程師就業(yè)班,抓住機遇,贏在未來。咨詢電話:趙老師 18510169390。
掃描二維碼 加入CDA人工智能工程師就業(yè)班
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10