AlphaGO已經進化兩次！不摒棄「人性」而是強化「學習」

匯流新聞網記者黃有容 / 綜合報導

人工智慧圍棋高手AlphaGo自5月23日起，5天3戰目前世界排名第一的棋士柯潔，第一戰毫不意外以1目半得勝。打造AlphaGo的DeepMind創始人兼執行長哈薩比斯（Demis Hassabis）和首席科學家席立維（David Silver）也在5月25日早上，在中國烏鎮會場與媒體分享這次AlphaGo的玄機。其中提到，現在的AlphaGo已今非昔比，進化到第3代的AlphaGo，預估排名積分能比柯潔高出1000多分。

【匯流新聞網】柯潔輸棋感嘆：AlphaGo不比棋士熱情、卻更大膽

席立維表示，這次與柯潔對戰的AlphaGo，與年初在網路上連取60勝的「Master」是同一個版本，版本名稱就是「AlphaGo Master」。而2015年10月初登場的是第一代AlphaGo Fan，2016年3月與韓國棋士李世乭連5戰的，則是第二代AlphaGo Lee。

在硬體方面，AlphaGo Fan還是使用GPU，而AlphaGo Lee已經使用50片Google自家研發的TPU，至於以前一代為基礎的AlphaGo Master，只用了1片TPU。

它們之間有何不同？若以圍棋ELO等級分來算，AlphaGo Fan的等級分約為2900分，而AlphaGo Lee則是3700分。李世乭目前的等級分為3530分，柯潔則是3625分。所以柯潔如果是向AlphaGo Lee叫戰，或許贏面更大。可惜一年後進化過的AlphaGo Master，被評估有4800分的實力。

要把等級分更具體化一些，DeepMind提供的簡報中顯示，AlphaGo Lee和AlphaGo Master的實力差距，大約是讓3子這麼多。柯潔用驚嚇來為大家解釋「讓3子」是什麼概念，他說「就像武林高手對決，讓你先捅三刀一樣…」

AlphaGo Master的進化，不在於它比上一代AlphaGo Lee更「聰明」多少，但是它會不停「學習」。Google讓其在每一次與自己的對弈中，把錯誤牢牢記下來。並且，Google不讓它一次計算完整盤棋的致勝路數，而是在每一次落子時，選擇「勝率最高」的。如此一來，AlphaGo Master變得更穩定，更沒有對手。

「我到底是在和一個怎樣可怕的對手下棋」，聽了這個座談，柯潔下了這個結論。然而，比賽還有兩場，身為人類棋士的最後一道防線，柯潔還是要憑著骨氣戰下去。

消息來源：雷鋒網

【文章轉載請註明出處】

【匯流筆陣】
CNEWS歡迎各界投書，來稿請寄至[email protected]，並請附上真實姓名、聯絡方式與職業身份簡介。
CNEWS匯流新聞網：https://cnews.com.tw

新聞照來源：翻攝自網路

AlphaGO已經進化兩次！不摒棄「人性」而是強化「學習」

匯流新聞網

LIFE

NCC邀民視會面討論換照股權爭議受關注

三星S8虹膜辨識被輕易破解了，只要照片加隱形眼鏡

延伸閱讀

【匯流書房】棋王談AI AlphaGo帶領世界重新認識人工智慧

第一次的人機配合賽，AlphaGo想投降就擺爛！

柯潔輸棋感嘆：AlphaGo不比棋士熱情、卻更大膽

會員登入