那些圍棋教我們的事

- 12月 30, 2018

自從兒子幼稚園開始學習圍棋，我跟太太就跟著一起研究，以免落伍。試想萬一他下棋遇到問題，或者缺人對奕，我們得先要會點功夫。做父母總是與孩子同進退，作伙學習，一起成長。想當初為了學ㄅㄆㄇ太太也下了不少苦工。

作者：張庭嘉

圍棋基本規則

圍棋規則很簡單，每一顆棋下在線與線的交叉上，左右上下各有1口氣(共有4個氣)，每一顆子落點的條件是(1)這顆棋不會被吃掉(不可以自殺)、或(2)這顆棋可以吃掉別人的子。

倘若這4口氣被擋住，這顆子就算是死掉，會被提走(被吃)。

由此規則再衍生下去，可以做出眼睛的形狀，對手是無法下在中央的，因為他就會馬上被吃掉。

但若從外圍被包住的情況，下子在眼睛裡面則是可以的，反而是白子被吃掉。(白子不能自己把眼睛堵上，因為會馬上被包圍吃掉(不能自殺))

由此可知，一隻眼睛很單薄，就算形成了也性命難保；進一步試想，若是兩隻眼睛的話呢？因為圍棋是一人一子輪流下，無法同時塞住兩隻眼睛，下在其中一眼又會馬上被吃掉不能下，因此兩隻眼睛是無敵的狀態。

旁觀兒子跟其他小朋友下棋，會注意到有些用功的孩子會努力去製造雙眼，當然另外一方也可以試圖阻礙作成雙眼。

在家與兒子對弈時，常常發生兒子不懂規則，比如：為何可以下子在眼睛裡反提、明明製造了雙眼卻事後又把自己把眼睛堵起來，有時我贏他太多他又會崩潰大哭。我初學也不會下指導棋，圍棋裡也不建議故意輸棋讓別人贏，這樣會磨損自己的功力變得消極，因此可考慮一開始讓對方子。

編按：由黑子方先擺一定數目的黑子在棋盤上，再由白子方開始下棋，白方因此先處於劣勢。

比賽判斷勝負使用(1)數子法、或(2)比目法；前者為目前國人常用計分方式，後者為韓國、日本所採用。如上圖，以9路圍棋為例，右方就劃分出黑白棋所佔地盤，接著將空地及子都算進去，再扣掉黑棋貼目7.5子。

編按：貼目即黑棋先下、白棋後下，黑棋在勝率上有優勢，故需要在一開始即負分(倒貼7.5子)與最後結果加總，用以平衡白棋的劣勢。

詳細計分法的介紹可參考：
http://maomaogogo.blogspot.com/2015/05/blog-post_37.html

AlphaGo的衝擊

2017年在Nature上發表的論文講述不需借助人類知識學習，AI從最基本的吃子規則開始自學起，一開始摸索的階段是緩慢的。

接受人類指導的AI(對照組：紫色實線)起先程度就不錯，但進步幅度有侷限，頂多跟人類相去不遠。AlphaGo Zero(實驗組：藍色實線)起初遜色於對照組，但逐漸可以趕上，且在自學40個小時後有跳躍性的超越，遙遙領先。

細看40個小時發生了甚麼事？AlphaGo Zero在40個小時前後，它發現人類現今普遍使用定石，於是大量使用，同時它的實力與人類旗鼓相當。

自學後70個小時，它便放棄用這些常見定石，使用頻率驟降。

編按：定石，又稱定式。是長年來經驗的累積傳承，形成在某些局面雙方都會遵循的固定下法。

70個小時左右，AlphaGo Zero開始自創定石，也發現為人所鄙棄的點三三其實不錯用，隨即大量使用。此時AlphaGo Zero實力已大幅超越人類水平，進入另一個境界。

自從DeepMind團隊發表這篇論文以來，對圍棋界影響甚鉅。AlphaGo Zero告訴我們：「現今人類大量使用的定石已然過時，我發明了更好的！」難道我們畢生苦苦鑽研定石的方向到頭來是大錯特錯？令人萬念俱灰。

積極一面想，圍棋智慧博大精深，如今人工智慧啟示我們往後還有很長的路要走，千萬不要誤以為未來僅此而已。圍棋界也受到激發模仿AlphaGo各版本的下棋風格，以求創建新的思路。

張庭嘉：我想漫漫說