Tag Archives: alphago

AlphaGo Zero 演算法的 Open Source 實做

Leela 的作者 Gian-Carlo Pascutto 依照 paper 的描述寫完了,放在 GitHub 上的 gcp/leela-zero: I made an open source re-implementation of AlphaGo Zero: https://t.co/p8H6gGohA1 It just needs a good weights file. — Gian-Carlo Pascutto (@gcpascutto) October 24, 2017 不過他在 Twitter 上也提到了,open source 實做不是真正的困難,真正的困難在於訓練完的資料,那個部份需要大量的成本才有辦法作到: Every … Continue reading

Posted in Computer, Game, Go, Murmuring, Programming, Recreation, Software|Tagged , , , , , , |Leave a comment

AlphaGo Zero 的計算量

在 AlphaGo Zero 論文裡有提到,用同樣的硬體 (4 TPU) 可以用 89:11 碾壓 AlphaGo Master (今年年初與柯潔下的那個版本),主要是得力於更高品質的 neural network 以及更強的選擇能力 (後面這塊應該是將兩個 nerual network 簡化為一後的好處): This neural network improves the strength of the tree search, resulting in higher quality move selection and stronger self-play in the … Continue reading

Posted in Computer, Game, Go, Murmuring, Network, Programming, Recreation, Science, Software|Tagged , , , , , , |Leave a comment

AlphaGo 與柯潔下的三盤棋,包括了雙方的講解

在 Aja Huang (黃士傑) 的 Facebook 上看到 AlphaGo 與柯潔在烏鎮下的三盤棋的講解,這次的講解除了找柯潔與樊麾以外,更重要的是直接拿了與當時相同配備的 AlphaGo 出來使用 (只要柯潔想要看某些變化 AlphaGo 會怎麼應對,樊麾都會輸入進去跑模擬): 需要說明的是,視頻中參與覆盤的AlphaGo與烏鎮峰會比賽的版本和硬體配置(搭配4個TPU的單機版)完全一樣。希望大家享受這三盤精彩的對局,也能從這三個視頻的覆盤研究中有所收穫。祝大家觀影愉快。

Posted in Computer, Game, Go, Murmuring, Recreation, Software|Tagged , , , , , , , |Leave a comment

關於圍棋貼目的問題...

前陣子 AlphaGo 大獲全勝後放出了五十盤自戰棋譜 (兩台 AlphaGo 自己下),其實有件事情有點出乎大家意料,而在圍棋界被一直討論。就是在這五十盤裡,黑棋與白棋的勝率比是 12:38 (中國規則,黑棋貼 7.5 目的情況),明顯白棋有強大的優勢。 這個 7.5 目指的是,由於黑棋先下 (先手優勢),所以圍的地會比較多,為了彌補白棋後下的這個缺點,一般都會設計「貼目」這個規則。 交大資工的 CGI 團隊在上個月月底發了一篇論文 (參考「CGOS Whole Period Ratings for 19x19 Board」這邊的記錄,在有參加 CGOS 的團隊裡只輸新版的 Zen),討論 value network 的新想法:「Multi-Labelled Value Networks for Computer Go」。 他們對貼目的數量做了分析: For the training data, … Continue reading

Posted in Computer, Game, Go, Lab, Murmuring, NCTU, Programming, Recreation|Tagged , , , , , , , , , , |Leave a comment

AlphaGo 又要重出江湖了

DeepMind 家的 AlphaGo 又要重出江湖了:「Exploring the mysteries of Go with AlphaGo and China's top players」。這次將會跟中國的頂尖職業棋手對弈,裡面提到三種賽制: The summit will feature a variety of game formats involving AlphaGo and top Chinese players, specifically designed to explore the mysteries of the game together. The … Continue reading

Posted in Computer, Game, Murmuring, Recreation, Science|Tagged , , , , |Leave a comment

AlphaGo 不是使用 GPU 加速...

Google 今天公佈的資料中說明了 AlphaGo 不是用一般常見的 GPU 加速運算:「Google supercharges machine learning tasks with TPU custom chip」。 這是特別為 TensorFlow 製作的 ASIC: The result is called a Tensor Processing Unit (TPU), a custom ASIC we built specifically for machine learning — and tailored for … Continue reading

Posted in Computer, Hardware, Murmuring|Tagged , , , , , , , , |Leave a comment

谷李五番棋今天開打

Google 的 DeepMind 所研發出來的 AlphaGo 與李世乭的「谷李五番棋」將在今天開打。 中國規則、兩個小時、一分鐘讀秒: The matches will be played under Chinese rules with a komi of 7.5 (the compensation points the player who goes second receives at the end of the match). Each player will receive two … Continue reading

Posted in Computer, Game, Murmuring, Recreation|Tagged , , , , , |Leave a comment

最近電腦圍棋的兩個突破...

昨天先看到 Mark Zuckerberg 丟出來的資訊,比較完整的資料可以在「Better Computer Go Player with Neural Network and Long-term Prediction」這邊看到。 Facebook 這邊的成就在於用 DCNN-based model 改善效率,可以用一台電腦 (包括 GPU) 維持在 KGS 5d (業餘五段),跟 Zen19 差不多的棋力,跟目前最好的電腦圍棋軟體棋力差不多: darkfmcts3now holds a stable KGS 5d level, on par with the top Go AIs, … Continue reading

Posted in Computer, Game, Murmuring, Recreation|Tagged , , , , , , |Leave a comment