99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀柯潔又輸了,關(guān)于人工智能AlphaGo你需要知道些什么
柯潔又輸了,關(guān)于人工智能AlphaGo你需要知道些什么
2017-05-26
收藏
前言
本月 23 日- 27 日,在烏鎮(zhèn)主辦“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”中,備受矚目的要數(shù)中國(guó)圍棋現(xiàn)役第一人、天才少年柯潔與Google AlphaGo(阿爾法狗)人工智能機(jī)器人的巔峰對(duì)決。AlphaGo與柯潔對(duì)弈的三局比賽,分別于 5 月 23 、25、27 日進(jìn)行。

在 23 日和 25 日的對(duì)決中,柯潔雖然發(fā)揮神勇,但還是兩局均戰(zhàn)敗。AlphaGo 2-0 領(lǐng)先,已經(jīng)贏得了三番棋的勝利。

對(duì)于人類來(lái)說(shuō),這看上去不太妙。

那么,AlphaGo 究竟是什么?關(guān)于 AlphaGo 我們需要了解些什么呢?

AlphaGo 和數(shù)字

AlphaGo 是由 Google DeepMind 開(kāi)發(fā)的圍棋程序,并在2015年歐洲圍棋錦標(biāo)賽中它以 5:0 贏得了樊麾,在歷史上第一次打敗頂尖職業(yè)圍棋選手。

在 AlphaGo 出現(xiàn)在公眾視野之前,有人預(yù)測(cè)根據(jù)如今的科技水平出現(xiàn)具有 AlphaGo 水平(擊敗人類職業(yè)棋手)的人工智能大約還需要 10 年的時(shí)間。

早在 20 年前,人工智能就在國(guó)際象棋上戰(zhàn)勝了人類,而東方古老的圍棋似乎成了人類最后的堅(jiān)持。

但事實(shí)讓人類失望了。

一切皆關(guān)于其復(fù)雜性。


圍棋和象棋都是完全信息博弈游戲,這意味著每個(gè)玩家都完全清楚之前發(fā)生的所有事件。而完全信息博弈,通常能被簡(jiǎn)化為尋找最優(yōu)值的樹(shù)搜索問(wèn)題。它含有 b 的 d 次方個(gè)可能分支,在國(guó)際象棋中有 b≈35,d≈80,即10123 種;而在圍棋中 b≈250,d≈150 即103?? 種。多核兆赫處理器一般可以每秒鐘進(jìn)行 10? 次操作,這意味著計(jì)算所有可能的步數(shù)的時(shí)間不可估量——數(shù)學(xué)就是這么殘酷。

AlphaGo 的最高目標(biāo)是有效的減少搜索路徑數(shù)量,具體是這在合理的時(shí)間內(nèi)( AlphaGo 每一步計(jì)算時(shí)間為 5 秒),計(jì)算出可能的步數(shù)(直到游戲結(jié)束)。

為了對(duì)博弈狀態(tài)進(jìn)行預(yù)判,AlphaGo 使用蒙特卡羅樹(shù)搜索(MCTS)——通過(guò)對(duì)搜索路徑的隨機(jī)抽樣來(lái)擴(kuò)展搜索樹(shù)來(lái)分析最可能贏的選項(xiàng)。在博弈游戲中,MCTS 的應(yīng)用是基于各種玩法,通過(guò)隨機(jī)選擇的方式來(lái)玩到最后。每一次的結(jié)果都被用來(lái)對(duì)博弈樹(shù)的節(jié)點(diǎn)進(jìn)行加權(quán),這樣更好的節(jié)點(diǎn)更有可能在之后的博弈中被選擇。

通過(guò)額外的策略(例如預(yù)測(cè)職業(yè)棋手的動(dòng)作)強(qiáng)化 MCTS ,使其達(dá)到更強(qiáng)的水平。

進(jìn)一步的改進(jìn)則基于良好的預(yù)先訓(xùn)練的深卷積網(wǎng)絡(luò)。這些被廣泛應(yīng)用于圖像分類、人臉識(shí)別或游戲中。

在 AlphaGo 中使用的神經(jīng)網(wǎng)絡(luò)的目標(biāo)是:有效位置評(píng)估(價(jià)值網(wǎng)絡(luò))和行為抽樣(策略網(wǎng)絡(luò))。

這也意味著 AlphaGo 的下棋方式除了學(xué)習(xí)別人的對(duì)局外,還可以自己跟自己下棋,通過(guò)對(duì)不同下法產(chǎn)生結(jié)果的分析來(lái)改善自己的下棋方式。這也就是說(shuō),學(xué)習(xí)時(shí)間長(zhǎng)、學(xué)習(xí)案例好的 AlphaGo 贏的可能性更大一些。

策略網(wǎng)絡(luò)

機(jī)器學(xué)習(xí)中為了訓(xùn)練策略網(wǎng)絡(luò),有以下步驟。

第一階段:
監(jiān)督學(xué)習(xí)(SL),即模仿學(xué)習(xí)。通過(guò)在 KGS (網(wǎng)絡(luò)圍棋對(duì)戰(zhàn)平臺(tái))上最強(qiáng)人類對(duì)手,百萬(wàn)級(jí)的對(duì)弈落子去訓(xùn)練大腦。這就是 AlphaGo 最像人的地方,目標(biāo)是去學(xué)習(xí)那些頂尖高手的妙手。AlphaGo 落子選擇器能正確符合 57% 的人類高手。(其他研究團(tuán)隊(duì)的最高正確率為44.4%)。

第二階段:
強(qiáng)化學(xué)習(xí)(RL),即自主學(xué)習(xí)。盡管SL策略網(wǎng)絡(luò)在預(yù)測(cè)下一步時(shí)很有效,但 RL 有助于預(yù)測(cè)最佳的(獲勝)步。在這一階段,AlphaGo 跟自己對(duì)弈,自己訓(xùn)練自己。

強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)策略對(duì)決取勝率高達(dá) 80% ,與 Pachi 獲勝率為 85% ,Pachi 是一個(gè)基于蒙特卡羅樹(shù)搜索法的人工智能,在 KGS 業(yè)余段位排名第二。以往 SL 與 Pachi 對(duì)決勝率僅為 11% 。

價(jià)值網(wǎng)絡(luò)

最后階段的訓(xùn)練集中在位置評(píng)估(估計(jì)當(dāng)前步數(shù)獲勝的概率)?;?KGS 數(shù)據(jù)集的訓(xùn)練會(huì)導(dǎo)致過(guò)度擬合(價(jià)值網(wǎng)絡(luò)傾向于記住游戲結(jié)果,而不是采取新的步數(shù)),因此避免這一現(xiàn)象,新的訓(xùn)練是進(jìn)行自我博弈(有 3000 萬(wàn)個(gè)不同的位置,每個(gè)都從單獨(dú)的游戲中取樣)。

經(jīng)過(guò)訓(xùn)練的價(jià)值函數(shù)比使用走棋策略的蒙特卡羅更精確,它的單次計(jì)算也與使用強(qiáng)化學(xué)習(xí)的蒙特卡羅的計(jì)算更相似(但計(jì)算量會(huì)少 15000 次)。

策略和價(jià)值網(wǎng)絡(luò)搜索

AlphaGo 在蒙特卡羅搜索樹(shù)中使用了策略和價(jià)值網(wǎng)絡(luò)的組合。游戲樹(shù)在模擬中被搜索,由以下階段組成:


在獲取棋局信息后,AlphaGo 會(huì)根據(jù)策略網(wǎng)絡(luò)(policy network)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結(jié)束時(shí),模擬過(guò)程中被系統(tǒng)最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過(guò)先期的全盤(pán)探索和過(guò)程中對(duì)最佳落子的不斷揣摩后,AlphaGo 的搜索算法就能在其計(jì)算能力之上加入近似人類的直覺(jué)判斷。

結(jié)語(yǔ)

AlphaGo 在近幾年頻頻出現(xiàn)在人們的視野里。和其他的圍棋人工智能機(jī)器人進(jìn)行了較量,在總計(jì) 495 局中只輸了一局,勝率是 99.8% 。它甚至嘗試了讓 4 子對(duì)陣 CrazyStone、Zen 和 Pachi 三個(gè)先進(jìn)的人工智能機(jī)器人,勝率分別是 77% 、86% 和 99% 。

2015 年,歐洲圍棋錦標(biāo)賽中它以 5:0 贏得了樊麾。這是第一次人工智能在人類最復(fù)雜的博弈游戲中挑戰(zhàn)最高級(jí)別的人類選手。

2016 年 3 月以 4:1 的比分戰(zhàn)勝了韓國(guó)選手李世石,之后 AlphaGo 以 Master 作為 ID 在網(wǎng)絡(luò)圍棋平臺(tái)上戰(zhàn)勝了眾多知名選手取得了 60 連勝的戰(zhàn)績(jī)。

而這次在“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”與中國(guó)圍棋現(xiàn)役第一人柯潔三番棋對(duì)決中,更是取得了前兩局的勝利。

未來(lái)即將來(lái)臨。

ref:

https://machinelearnings.co/understanding-alphago-948607845bb1


原作者 Mirek Stanek
編譯 CDA 編譯團(tuán)隊(duì)
本文為  CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }