AlphaZero 完爆前輩AlphaGo Zero,還贏了西洋棋和象棋最強 ... | 寵物協尋網
2017年12月8日—訓練34個小時的AlphaZero勝過了訓練72小時的AlphaGoZero。#趨勢,人工智慧,DeepMind,AlphaZero(alphazero)
本文獲合作媒體 極客公園 授權轉載。[1]
Google 旗下人工智慧公司 DeepMind 發布了一篇新論文「Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm[2]」,它講述了團隊如何利用 AlphaGo 的機器學習系統,構建了新的項目 AlphaZero。AlphaZero 使用了名為「強化學習」(reinforcement learning)的 AI 技術,它只使用了基本規則,沒有人的經驗,從零開始訓練,橫掃了棋類遊戲 AI。
AlphaZero 首先征服了圍棋,又完爆其他棋類遊戲:相同條件下,該系統經過 8 個小時的訓練,打敗了第一個擊敗人類的 AI——李世乭版 AlphaGo;經過 4 個小時的訓練,打敗了之前最強西洋棋 AI Stockfish,2 個小時打敗了最強象棋 AI Elmo。連最強圍棋 AlphaGo 也未能倖免,訓練 34 個小時的 AlphaZero 勝過了訓練 72 小時的 AlphaGo Zero。
AlphaZero 在比賽中贏,平局或輸的局數(來自 DeepMind 團隊論文) 強化學習這麼強大,它是什麼?知名 AI 部落格作者 Adit Deshpande 來自加州大學洛杉磯分校(UCLA),他曾在部落格中發表過「深度學習研究評論[3]」系列文章,解讀了 AlphaGo 勝利背後的力量。他在文章中介紹到,機器學習領域可以分為三大類:監督學習、無監督學習和強化學習。強化學習可以在不同的情景或者環境下學習採取不同的行動,以此來獲得最佳的效果。
Adit Deshpande 的《Deep Learning Research Review Week 2: Reinforcement Learning》我們想像一個小...
AlphaGo Zero | 寵物協尋網
從無知到無敵:AlphaGo Zero 是怎麼辦到的? | 寵物協尋網
DeepMind以AlphaZero擊敗全球三大棋藝AI,連AlphaGo Zero ... | 寵物協尋網
【特別企劃】Alphago Zero 有多強【第四集】以後 ... | 寵物協尋網
AlphaZero 完爆前輩AlphaGo Zero,還贏了西洋棋和象棋最強 ... | 寵物協尋網
AlphaGo 再進化!通用演算法AlphaZero 再攻克幾種棋又有何難 | 寵物協尋網
人工智慧如何用來下圍棋(二):從AlphaGo到AlphaGo Zero | 寵物協尋網
混種犬-阿發遺失 - 黑 9.9E+14
於「南投縣國姓鄉北港村長北路」遺失的混種犬阿發,以下提供飼主姓名、電話、Email,以及晶片號碼、寵物外觀及特徵等資訊,...