伊莉討論區

標題: 黃士傑返台分享AlphaGo Zero開發過程 [打印本頁]

作者: pplay2    時間: 2017-11-8 06:35 PM     標題: 黃士傑返台分享AlphaGo Zero開發過程

本帖最後由 pplay2 於 2017-11-8 06:36 PM 編輯

轉自: https://tw.news.yahoo.com/alphago-zero-062929823.html

中央研究院今(8)日指出,谷歌電腦演繹人工智慧(AI)系統AlphaGo的幕後推手黃士傑,10日將在中研院演講,和外界分享超越人類累積千年圍棋智慧的AlphaGo Zero開發過程。

中研院表示,由中研院資訊科學研究所與台灣資料科學協會共同主辦的「2017台灣人工智慧年會x 2017台灣資料科學年會」明天起一連4天將在中研院登場。

中研院表示,比較特別的是,今年台灣人工智慧年會在10 日邀請谷歌電腦演繹人工智慧(AI)系統AlphaGo的幕後推手黃士傑,以「AlphaGo-深度學習與強化學習的勝利」為主題,所做的演講。

今年5月,Google旗下AI實驗室DeepMind公司創造的AlphaGo,與圍棋世界冠軍柯潔在中國烏鎮對弈,結果以3:0勝出,人工智慧的發展震驚全世界。不到半年,這個實驗室又創造出更強大的AlphaGo Zero,它完全不需要倚靠人類的知識和指導,從零開始自我訓練,3天時間就100:0打敗舊版。

在過去,強大的人工智慧得依靠人類事前輸入大量資料,幫助它學習、訓練技能,Alpha Go成為圍棋大師前也不例外。前不久,DeepMind公司在《自然》(Nature)科學期刊上發表一篇學術論文〈不需要人類知識就稱霸圍棋〉(Mastering the game of Go without human knowledge),展示了強化版的程式AlphaGo Zero,證明在全球最困難的棋藝競技中,人工智慧可以在沒有任何人類知識的基礎上,純粹靠自我學習成為制霸王者。

AlphaGo Zero代表從零開始,DeepMind開發團隊只輸入基本圍棋規則,之後它會自行下棋,並記錄每次的勝負決策,不停學習,自己成為自己的老師,加上沒有人類的經驗和成規束縛,讓人工智慧突破舊有的知識限制,發展出新的弈棋策略,達到登峰造極的境界。

DeepMind指出,他們不使用任何人類知識,AlphaGo Zero用上的是新的「強化學習」方法,透過神經網路和演算法結合,持續自我對弈練習幾百萬、幾千萬場,每次的更新都能增強、調整系統,用以預測下一步落子的方向和遊戲輸贏走勢。幾天時間內,AlphaGo Zero就從一塊純潔的白板,在上頭不斷揮灑、創造知識,很快勝過了人類累積千年的圍棋智慧。

黃士傑臉書介紹 AlphaGo Zero 的神奇表現:

1、AlphaGo Zero 從空白開始,完全只靠自學下圍棋。

2、僅僅 36 小時,AlphaGo Zero 就摸索出所有基本且重要的圍棋知識,達到了與李世乭九段對戰的 AlphaGo v18 的相同水平。

3、3天後,AlphaGo Zero 對戰 AlphaGo v18 達到 100%的勝率。

4、不斷進步的 AlphaGo Zero 達到了 Master 的水平。Master 即年初在網路上達成 60 連勝的 AlphaGo 版本。

5、40 天後,AlphaGo Zero 對戰 Master 達到近 90%勝率,成為有史以來 AlphaGo 棋力最強的版本。

6、雖然 AlphaGo Zero 沒有公開下過棋,在論文中附上了 AlphaGo Zero 的 80 局棋 ,供大家研究。從圍棋技術的角度來說,AlphaGo Zero 自學所發現的圍棋觀念,例如打劫、征子、棋形、開局先下在角部,開局定式等等,絕大部分與人類的圍棋觀念是一致的,這也間接呼應了人類幾千年以來圍棋研究的價值。

7、AlphaGo Zero 的棋風特別好戰,並且也喜歡直接點33。從論文內容來說,這主要是一篇強化學習的論文,關鍵技術在於強化學習訓練 pipeline 的效能極大化。
作者: jackyoy    時間: 2017-11-12 02:02 PM

感覺這人工智慧真的越來越可怕了......
作者: ashiby    時間: 2017-11-18 10:59 PM

AI的發展
已經不是當年深藍的邏輯了
令人不勝唏噓阿
作者: ai0201    時間: 2018-11-14 08:25 AM

這顯示出一項重要的數據涵義,給予限度下的規則,能自我演進~!

人工智慧不再依靠"大數據的建立",而是能自我深度思索並快速演進,
就人類圍棋發展歷史的演進與之相同模式,這已然快速達到人類千年之水準。

不得不承認,未來科技真是ai智慧的來臨~
作者: princewzyc    時間: 2018-11-25 11:30 AM

在限定規則的前提下,AI已經强大到無以復加的地步了。
當這些算法運用到金融、工業領域后,不知道有多少人要失業啊。
作者: jervislee    時間: 2018-11-28 10:19 AM

個人覺得金融倒還好,如果以隨機理論來說,就算 AI 再怎麼聰明,也是只有 50% 勝率
作者: s98105004    時間: 2018-12-2 01:10 AM

不停學習,自己成為自己的老師加上不斷進步的儲存技術和運算速度,到最後圍棋會不會變成兩台機器在對戰呢...




歡迎光臨 伊莉討論區 (http://www689.eyny.com/) Powered by Discuz!