AI聰明更勝人類？不靠人類數據新版AlphaGo Zero超強－e3ritapx41

Google 旗下 DeepMind 開發出來的 AlphaGo，在人類圍棋界打遍世界無對手，但最近卻遭到一名小老弟 100:0 的局數完虐。DeepMind 在《Nature》揭曉比來論文，介紹最新版的 AlphaGo Zero，純粹靠強化進修，就成為最強的棋士。

原先舊版 AlphaGo 開辟時，先靠人類千年的智慧奠定，由曩昔的棋譜強化進修運算，算是綜合各家招數後自成一派。但是最新版的 AlphaGo Zero，研究人員只供應遊戲的法則，在不依賴人類數據之下自學，效果「無招勝有招」，表現更勝前代 AlphaGo。

DeepMind 作者群在論文中寫道，AlphaGo Zero 證實了即便在最具挑戰的範疇，純強化學習的方式也是完全可行的－完全不需要人類供給範例或指點，不提供根基劃定規矩以外的任何範疇常識，利用強化學習就可以夠超出人類的水準。

另外，純強化進修方式只花費額外很少的練習時間，相較於利用人類數據，實現了更好的漸進機能（asymptotic performance）。

在很多情形下，人類數據，特殊是專家數據，常常太過昂貴，或底子無法獲得。因此，作者認為，假如雷同的手藝可以應用到其他問題上，這些沖破就有可能對社會產生積極的影響。

DeepMind 在論文中指出，在進行了 3 天的自我練習後，AlphaGo Zero 在 100 局競賽中以 100：0 擊敗了上一版本的 AlphaGo，也就是打敗南韓九段棋士李世乭的版本。以後，再經 40 天的自我訓練後，AlphaGo Zero 變得加倍壯大，超越了「Master」版本的 AlphaGo－完勝柯潔的版本。

Facebook讚好
Facebook買讚好
買

以下文章來自: https://tw.news.yahoo.com/%E4%B8%8D%E9%9D%A0%E4%BA%BA%E9%A1%9E%E6%95%B8%E6%93%9A%E5%8F%8D%E8%80%8C%E

hansondp8m2

e3ritapx41

hansondp8m2 發表在痞客邦留言(0) 人氣()

E-mail轉寄

全站分類：不設分類
上一篇：蘋果攻AR頭戴裝置領頭邁向出貨高峰
下一篇： 1天4杯黑咖啡 30歲女骨質疏鬆.脊椎變形　彌補維他命D+鈣女病患骨質疏鬆漸改良

歷史上的今天

▲top

e3ritapx41

買facebook讚好，IG 粉絲保證最平宜SEO 買facebook讚好，IG 粉絲保證最平宜SEO www.hkemarketing.net EMARTETING