AlphaGO已經進化兩次!不摒棄「人性」而是強化「學習」 - 匯流新聞網

LIFE

AlphaGO已經進化兩次!不摒棄「人性」而是強化「學習」
AlphaGO已經進化兩次!不摒棄「人性」而是強化「學習」

匯流新聞網記者黃有容 / 綜合報導

人工智慧圍棋高手AlphaGo自5月23日起,5天3戰目前世界排名第一的棋士柯潔,第一戰毫不意外以1目半得勝。打造AlphaGo的DeepMind創始人兼執行長哈薩比斯(Demis Hassabis)和首席科學家席立維(David Silver)也在5月25日早上,在中國烏鎮會場與媒體分享這次AlphaGo的玄機。其中提到,現在的AlphaGo已今非昔比,進化到第3代的AlphaGo,預估排名積分能比柯潔高出1000多分。

【匯流新聞網】柯潔輸棋感嘆:AlphaGo不比棋士熱情、卻更大膽

席立維表示,這次與柯潔對戰的AlphaGo,與年初在網路上連取60勝的「Master」是同一個版本,版本名稱就是「AlphaGo Master」。而2015年10月初登場的是第一代AlphaGo Fan,2016年3月與韓國棋士李世乭連5戰的,則是第二代AlphaGo Lee。

在硬體方面,AlphaGo Fan還是使用GPU,而AlphaGo Lee已經使用50片Google自家研發的TPU,至於以前一代為基礎的AlphaGo Master,只用了1片TPU。

它們之間有何不同?若以圍棋ELO等級分來算,AlphaGo Fan的等級分約為2900分,而AlphaGo Lee則是3700分。李世乭目前的等級分為3530分,柯潔則是3625分。所以柯潔如果是向AlphaGo Lee叫戰,或許贏面更大。可惜一年後進化過的AlphaGo Master,被評估有4800分的實力。

要把等級分更具體化一些,DeepMind提供的簡報中顯示,AlphaGo Lee和AlphaGo Master的實力差距,大約是讓3子這麼多。柯潔用驚嚇來為大家解釋「讓3子」是什麼概念,他說「就像武林高手對決,讓你先捅三刀一樣…」

AlphaGo Master的進化,不在於它比上一代AlphaGo Lee更「聰明」多少,但是它會不停「學習」。Google讓其在每一次與自己的對弈中,把錯誤牢牢記下來。並且,Google不讓它一次計算完整盤棋的致勝路數,而是在每一次落子時,選擇「勝率最高」的。如此一來,AlphaGo Master變得更穩定,更沒有對手。

「我到底是在和一個怎樣可怕的對手下棋」,聽了這個座談,柯潔下了這個結論。然而,比賽還有兩場,身為人類棋士的最後一道防線,柯潔還是要憑著骨氣戰下去。

消息來源:雷鋒網 

【文章轉載請註明出處】

【匯流筆陣】
CNEWS歡迎各界投書,來稿請寄至[email protected],並請附上真實姓名、聯絡方式與職業身份簡介。
CNEWS匯流新聞網:https://cnews.com.tw

新聞照來源:翻攝自網路


R18