那些圍棋教我們的事

自從兒子幼稚園開始學習圍棋,我跟太太就跟著一起研究,以免落伍。試想萬一他下棋遇到問題,或者缺人對奕,我們得先要會點功夫。做父母總是與孩子同進退,作伙學習,一起成長。想當初為了學ㄅㄆㄇ太太也下了不少苦工。

作者:張庭嘉

圍棋基本規則

圍棋規則很簡單,每一顆棋下在線與線的交叉上,左右上下各有1口氣(共有4個氣),每一顆子落點的條件是(1)這顆棋不會被吃掉(不可以自殺)、或(2)這顆棋可以吃掉別人的子。





倘若這4口氣被擋住,這顆子就算是死掉,會被提走(被吃)。





由此規則再衍生下去,可以做出眼睛的形狀,對手是無法下在中央的,因為他就會馬上被吃掉。






但若從外圍被包住的情況,下子在眼睛裡面則是可以的,反而是白子被吃掉。(白子不能自己把眼睛堵上,因為會馬上被包圍吃掉(不能自殺))





由此可知,一隻眼睛很單薄,就算形成了也性命難保;進一步試想,若是兩隻眼睛的話呢?因為圍棋是一人一子輪流下,無法同時塞住兩隻眼睛,下在其中一眼又會馬上被吃掉不能下,因此兩隻眼睛是無敵的狀態。

旁觀兒子跟其他小朋友下棋,會注意到有些用功的孩子會努力去製造雙眼,當然另外一方也可以試圖阻礙作成雙眼。

在家與兒子對弈時,常常發生兒子不懂規則,比如:為何可以下子在眼睛裡反提、明明製造了雙眼卻事後又把自己把眼睛堵起來,有時我贏他太多他又會崩潰大哭。我初學也不會下指導棋,圍棋裡也不建議故意輸棋讓別人贏,這樣會磨損自己的功力變得消極,因此可考慮一開始讓對方子。

編按:由黑子方先擺一定數目的黑子在棋盤上,再由白子方開始下棋,白方因此先處於劣勢。




比賽判斷勝負使用(1)數子法、或(2)比目法;前者為目前國人常用計分方式,後者為韓國、日本所採用。如上圖,以9路圍棋為例,右方就劃分出黑白棋所佔地盤,接著將空地及子都算進去,再扣掉黑棋貼目7.5子。

編按:貼目即黑棋先下、白棋後下,黑棋在勝率上有優勢,故需要在一開始即負分(倒貼7.5子)與最後結果加總,用以平衡白棋的劣勢。

詳細計分法的介紹可參考:
http://maomaogogo.blogspot.com/2015/05/blog-post_37.html


AlphaGo的衝擊






2017年在Nature上發表的論文講述不需借助人類知識學習,AI從最基本的吃子規則開始自學起,一開始摸索的階段是緩慢的。

接受人類指導的AI(對照組:紫色實線)起先程度就不錯,但進步幅度有侷限,頂多跟人類相去不遠。AlphaGo Zero(實驗組:藍色實線)起初遜色於對照組,但逐漸可以趕上,且在自學40個小時後有跳躍性的超越,遙遙領先。




細看40個小時發生了甚麼事?AlphaGo Zero在40個小時前後,它發現人類現今普遍使用定石,於是大量使用,同時它的實力與人類旗鼓相當。

自學後70個小時,它便放棄用這些常見定石,使用頻率驟降。

編按:定石,又稱定式。是長年來經驗的累積傳承,形成在某些局面雙方都會遵循的固定下法。




70個小時左右,AlphaGo Zero開始自創定石,也發現為人所鄙棄的點三三其實不錯用,隨即大量使用。此時AlphaGo Zero實力已大幅超越人類水平,進入另一個境界。

自從DeepMind團隊發表這篇論文以來,對圍棋界影響甚鉅。AlphaGo Zero告訴我們:「現今人類大量使用的定石已然過時,我發明了更好的!」難道我們畢生苦苦鑽研定石的方向到頭來是大錯特錯?令人萬念俱灰。

積極一面想,圍棋智慧博大精深,如今人工智慧啟示我們往後還有很長的路要走,千萬不要誤以為未來僅此而已。圍棋界也受到激發模仿AlphaGo各版本的下棋風格,以求創建新的思路。

這個網誌中的熱門文章

傻傻分不清楚:VPC還是APC?

TCP怎麼用?經皮體外心臟節律器

最重要的小事:氣切套管 (Tracheostomy Tube) 之一