
從"深藍"到 AlphaGo丨AI 在游戲領域的升級打怪之路
可以說,AI的發(fā)展進化史就是AI在游戲領域的升級史。
SciShow是Youtube上熱門的科普向脫口秀節(jié)目。它的內(nèi)容包羅萬象,無論什么問題在這里都會得到風趣又詳盡的解答。在本次節(jié)目中,介紹了AI 是如何在游戲領域通過不斷的升級發(fā)展,一步步碾壓人類的。
CDA字幕組對該視頻進行了漢化,附有中文字幕的視頻如下:
AI 在游戲領域的發(fā)展進化史
針對不方便打開視頻的小伙伴,CDA字幕組也貼心的整理了文字版本,如下:
機器贏了。機器如今幾乎能夠打敗人類發(fā)明的所有游戲。這都歸功于一些我們通過AI實現(xiàn)的技術。
人工智能丨AI
AI最簡單定義是: 為解決問題而設計的計算機程序。
大多數(shù)程序,包括你此刻看視頻用到的,都是不能解決問題的。相反,這些程序執(zhí)行程序員編寫的指令。它們不會自己得出完成任務的方案。而AI會嘗試自己得出解決方案。AI越聰明,越能解決更復雜的問題。
自從計算機編程出現(xiàn)以來,我們就開始教AI玩游戲。比如跳棋和國際象棋,還有中國的棋盤游戲——圍棋。原因是游戲能很好地衡量AI到底有多聰明。玩游戲并取勝,需要解決問題的能力。解決問題的能力正是衡量智能的標準。因為無論對觀眾還是計算機程序而言,當中對問題的定義都很明確,沒有模棱兩可的結果。AI要么能夠玩跳棋,要么不能。
游戲是開發(fā)新型AI的絕佳實驗室環(huán)境,這就是為什么AI的發(fā)展歷史也是AI玩游戲的歷史。
跳棋丨Checkers
AI在游戲第一次打敗人類對手是一個跳棋程序。
于1950年代,由美國計算機科學家Arthur Samuel開發(fā),在IBM 704計算機上運行。
這臺機器通過錄入磁盤進行編程。跳棋游戲很簡單,但IBM 704是個很簡單的機器。它不能通過試錯法得出所有可能的棋步,從而得出最佳的移動方式,至少無法在合理的時間內(nèi)完成。除非采用暴力算法,當中需要大量的數(shù)字計算。
計算機算出一個棋步后可能出現(xiàn)的各種棋局,然后選擇取勝概率最好的棋步。這個方法盡管不夠創(chuàng)新,但切實可行。之后我們再回到這個話題。
問題是,暴力算法需要大量的計算資源,從而對數(shù)字進行計算,然而在1950年代沒有那些資源。因此,最初AI玩游戲主要靠的是啟發(fā)法(heuristics)。從此之后所有的AI用到了啟發(fā)法。
啟發(fā)法是經(jīng)驗法則(rule of thumb),盡管不是一直都正確,但是大多時候是正確的。在計算機科學中,啟發(fā)法是一種算法。通過選擇并不是最好,但足夠解決問題的方案,以此來限制蠻力搜索。
一旦跳棋算法發(fā)現(xiàn)能夠吃掉對手棋子的棋步,然后就停止了,就按這個棋步走。這種簡單的啟發(fā)法足以攻克跳棋。
撲克牌丨Poker
接下來,AI面對的是撲克牌游戲。
1970年代,計算機科學家Donald Waterman編寫能夠玩抽牌撲克游戲的程序。該游戲給玩家5張牌,可以最多換3張牌。
當中他開發(fā)了所謂的"生產(chǎn)系統(tǒng)"(production system)。如今AI當中都包含這一技術。
生產(chǎn)系統(tǒng)使用預先編好的規(guī)則來對符號進行分類,比如撲克牌的符號。Watermen開發(fā)的系統(tǒng)根據(jù)手上已有的牌,對牌的價值大小進行分類。比如一張梅花4,就其本身而言無足掛齒,但如果你手上還有一張方片4和一張黑桃4,那么這張梅花4的價值就會大幅提升。系統(tǒng)將評估這手牌的好壞,以及選擇出手還是棄牌。通過把這手牌的價值,與預先編程的所謂好牌和壞牌進行比較。
啟發(fā)法與生產(chǎn)系統(tǒng)。
前者要依靠經(jīng)驗法則;后者則根據(jù)復雜的規(guī)則比較系統(tǒng)。這兩者的結合,讓AI玩簡單的棋類游戲變得輕而易舉。
但是國際象棋不是簡單的棋類游戲,而是更復雜的棋類游戲,要想取勝則需要運用一些成熟技術。
沉思 丨Deep Thought
1980年代,第一批國際象棋機在卡內(nèi)基梅隆大學誕生。
這些早期的機器中,最成功的是"沉思"(Deep Thought)。每秒能計算70萬個棋步。
1988年,Deep Thought試圖擊敗一名國際象棋高手。但那并不是一般的象棋高手,這位棋圣在八 九十年代甚至如今,一直是世界上最頂尖的國際象棋高手。他就是加里·卡斯帕羅夫。
開始Deep Thought根本不是卡斯帕羅夫的對手,打敗卡斯帕羅夫需要更快更強大的機器。對Deep Thought進行升級,包括以下改進:
第一、需要更多的內(nèi)存和多處理器,即計算能力。Deep Thought的后代產(chǎn)品"深藍"(Deep Blue)應運而生,它是更強大的機器。
第二、更好的軟件。當處理數(shù)以百萬計互相對比的搜索結果時,速度慢是個大問題。為此,深藍被設計為適合并行處理。另外,系統(tǒng)還要考慮衡量一些更微妙的棋位。換句話說,采用了更優(yōu)的啟發(fā)法。
深藍丨 Deep Blue
第一代深藍的搜索速度約為每秒5千萬到1億個棋位。與Garry 卡斯帕羅夫?qū)?zhàn)時,它以2:4慘敗給對手。每秒計算1億個棋位,仍不足以擊敗人類的國際圍棋冠軍。
為此,深藍團隊在系統(tǒng)中增加了一倍的芯片,同時改進了軟件,使每個芯片效率提升了25%。1997年與卡斯帕羅夫再次對戰(zhàn)時,其運算速度達到了每秒3億棋位,從而大獲全勝。
深藍的勝利是計算機程序中的偉大壯舉。當深藍擊敗卡斯帕羅夫時,它是當時世界上最復雜的AI。但總體還是靠暴力算法來實現(xiàn)的。對己方或?qū)Ψ降拿總€可能的棋步進行暴力搜索,然后選出獲勝概率最大的棋步。如果無法戰(zhàn)勝對方,程序員升級程序從而計算更多的數(shù)字,但這種方法對圍棋就不適用了。
圍棋丨Go
我們之前的節(jié)目說過,谷歌的AlphaGo在2016年3月,擊敗了世界圍棋冠軍李世石。但是讓我們探究一下,為什么AI攻克圍棋是艱巨的任務。
如果你生活在西方國家,你可能對圍棋不熟悉。圍棋是一個中國的棋類游戲,數(shù)千年來其規(guī)則從未改變。有時被描述為"東方版國際象棋”,但是圍棋要比國際象棋復雜得多,尤其對計算機而言。
首先,圍棋棋盤比國際象棋要大。
圍棋棋盤為19×19的網(wǎng)格,國際象棋棋盤為8×8。但這實際低估了圍棋的復雜性,因為圍棋的棋子不是放在網(wǎng)格中,而是放在四個角上。也就是說每個網(wǎng)格代表四種可能的位置,即與周圍網(wǎng)格的交叉點??偠灾?,圍棋中的棋步組合比宇宙中原子數(shù)量還多。
其次,圍棋中每個棋子都同等重要。
這與國際象棋不同,比如國際象棋中,后就比兵要重要。這種關系是可以通過編程讓AI理解的,比如輸入生產(chǎn)系統(tǒng)。但是圍棋棋子的價值取決于,各個棋子在棋盤位置的相互關系。
圍棋的目標是用在對弈過程中,以雙方棋子所圍"地"的大小決定勝負,所以每次棋步都是很主觀的。甚至高水平的棋手有時也很難解釋,他們是如何判斷每個棋步和好壞。
計算機不擅長的領域就是主觀性,以及計算萬億次的位置。因此深藍的暴力算法對于圍棋是完全不可取的。
阿爾法狗丨AlphaGo
AlphaGo并不是采用暴力算法的系統(tǒng),而是使用深度神經(jīng)網(wǎng)絡。面部識別也是利用的該技術。并不是對一個個棋子的位置進行計算,而是通過尋找棋盤中的模式。
如同面部識別系統(tǒng)會搜尋眼睛、鼻子、嘴等圖像。AlphaGo尋找提供強大或薄弱戰(zhàn)術的棋子模式。但它要如何明確什么會帶來有力或不利的局面呢? 我們提過每個特定位置的價值是主觀的,不是么?
那么你需要了解深度神經(jīng)網(wǎng)絡的運行原理。
深度神經(jīng)網(wǎng)絡由不同機器系統(tǒng)的層構成,這稱為神經(jīng)元。這些神經(jīng)元全都堆疊在一起、并行運行。從而神經(jīng)網(wǎng)絡能夠?qū)ν粋€問題,從多個不同角度、同時進行分析。
每個層根據(jù)不同標準評判同一圖像,其中一層將看到圍棋棋盤的圖像,選出當中所有合理的棋步;下一層將找到棋盤中還未被控制的區(qū)域;再下面一層會追蹤,自從一位棋手在任何區(qū)域落子,已經(jīng)過了多久時間。從而告訴系統(tǒng),哪片區(qū)域目前處于爭奪狀態(tài),哪片區(qū)域暫時安全、可以先忽視。接下來的一層,會把白字黑字的模式與內(nèi)部數(shù)據(jù)庫進行比較,看目前棋局是否類似之前看到過的。諸如此類。
AlphaGo的神經(jīng)元共用48層,每一層都用不同的方式分析棋局,并且這些層相互傳遞信息。因此如果某層發(fā)現(xiàn)很有利的棋步,那么其他層就會關注棋局的這個部分。一旦所有層都認同,某個棋步符合它們判斷好棋的標準,AlphaGo就會落子。通過這種方式使用深度神經(jīng)網(wǎng)絡,系統(tǒng)就能模仿人類的直覺和創(chuàng)造力。
最終,AlphaGo以4:1擊敗李世石,李世石相當于圍棋領域的卡斯帕羅夫。但AlphaGo只會變得越來越聰明。
AI的下一個挑戰(zhàn)丨 What’s next
在游戲領域 AI幾乎沒有尚未攻克的挑戰(zhàn)了,圍棋是人類設計的最復雜的棋類游戲。但我還想看AI挑戰(zhàn)魔鎮(zhèn)驚魂(Arkham Horror:一款難度頗高的桌游)。
總之,我們設計了AlphaGo和深藍。這些程序都是人類智力和好奇心的表現(xiàn)。
如果我們開發(fā)的AI能夠在最復雜的游戲中擊敗該領域的人類頂尖高手,那么誰知道我們還能做出什么呢?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04