AlphaGo是什麼?對韓國的李世乭、中國的柯潔等頂級棋士來說,有很不同的解釋。 Google旗下的Deep Mind公司為圍棋世界帶來前所未有的衝擊。AlphaGo發展至今,已達成戰勝世界頂尖棋士的目標。而開發AlphaGo的Google公司,也將帶領AlphaGo進一步從棋盤走向社會。面對AlphaGo帶來的變化,首當其衝的知名職業棋士,正是參與圍棋軟體開發的王銘琬。他眼中的AlphaGo,究竟是何種面貌呢?

X DAY

遊戲機的歷史,最早可以追溯到一七七○年名為「土耳其人」的西洋棋機器人。 這台機器連戰連勝,強悍無比。後來發現是有人躲藏在機器裡面下棋,不過當時「土耳其人」的確也引發許多人的好奇心。「人和機器對決時,哪一方會獲勝?」無論哪個時代,人和機器的較勁總是眾所矚目的話題。

對於電腦程式師而言,以遊戲來測試電腦能力,一直是很有效的方式。程式師將電腦贏過人類的日子稱為「X DAY」,作為明確的目標。這一天的到來,對程式師具有很大的意義。

一九九七年,電腦西洋棋軟體「深藍」擊敗西洋棋世界冠軍卡斯巴羅夫,震撼全世界。不過在那之後,仍然很少人認為人類真正敗給了機器。畢竟電腦的計算速度遠勝於人類,很多人認為深藍之所以能夠取勝,只不過是因為享有計算速度的優勢罷了。

然而,二○一六年三月,圍棋AIAlphaGo擊敗圍棋世界冠軍李世乭,卻帶來了遠比深藍強大的震撼.比賽為五局決勝,AlphaGo不僅以四勝一敗取得勝利,在內容上也壓倒了對手,因為如此,這次世界認識了電腦能力超過人類的現實。

至今為止,「電腦凌駕於人類之上」頂多是出現在科幻片中的情節,但AlphaGo 的獲勝,讓全世界開始認真討論和面對「AI贏過人類」這個重要現象。而這不只是一時的風潮,相關討論與時俱增直到現在,每當討論AI的議題,二○一六年 AlphaGo 和李世乭的對戰照片仍不時會被拿出來作為開場白;可見AlphaGo 的勝利是如此重要,具有跨時代的意義。

深藍獲勝之後,圍棋可說是人類僅剩的堡壘。圍棋的變化多端遠勝西洋棋,而圍棋需模糊判斷的特質,也是當時電腦的弱項。直到AlphaGo 問世之前,歐美對圍棋的定位是以「電腦也難以取勝的遊戲」聞名的。

我有緣於二○一四年參與開發圍棋軟體,不過並沒有讓圍棋軟體勝過人類的野 心。電腦圍棋軟體雖然在二○○六年有飛躍的進步,但還是遠遠不及頂尖棋士。在 AlphaGo 登上國際舞台之前,從西洋棋和將棋的經驗判斷,許多人都認為X DAY 最少還要等上十年,而且連要從何著手都沒看清楚。

深層學習

AlphaGo 和至今軟體最大的不同,在於使用了「深層學習」技術。 AlphaGo由Google旗下的Deepmind公司所開發, 負責人傑米斯. 哈薩比斯表示, 「AI可分強AI與弱AI,弱AI只會做人類教它的事情,而強AI能夠自己觀察所處的環境,並以適應環境來成長」,深層學習正是強AI的關鍵技術。

電腦過往的「機器學習」方式,只會學習資料裡被人類所指定的特徵,將指定特徵有關部分加以整理、學習。但是深層學習不是學習被指定的特徵,而是能自動自發從資料找出特徵來進行學習的技術。

已往人類只能教電腦去學「可以說明的」事情,因為電腦是聽人類的命令行動無法說明清楚就無法教它學會,所以電腦不可能學會「無法說明」的內容,自然也無法做出人類沒有教過的事情。

然而不需要人類指導的深層學習技術,讓電腦能開始去理解不容易說明的「只能意會,不能言傳」的事物與內容;這樣的內容,人們常用 「感覺」這個語彙來表現,就像圍棋也常用「感覺」這兩個字眼。換句話說,深層學習就是能夠讓電腦學會「感覺」的技術。

比方說孩子能夠認得母親的臉孔,學會走路或堆積木等等,這些事看似簡單, 但其中包含難以用言語形容的感覺;而深層學習能讓電腦學會做這些事情或判斷。

只會照著人所教的內容去做的軟體不管能力多強,只要發生前所未有的狀況,它們就無法應對。但擁有藉由深層學習所獲得的「感覺」的軟體,就有自己的「世界觀」,因此能處理各式各樣的狀況。

例如孩子所認知的「母親」,不只是正面朝自己微笑的母親,也有發怒的母親、用側臉對著自己的母親、被家具遮擋住半邊臉的母親,還有母親的背影等等,和小孩子一樣,深層學習都有能力去認識。

圍棋規則極為簡單,反而讓電腦不容易找到明顯特徵,內容難用言語形容;因此下棋時必須動用「感覺」的比例比起別的遊戲高得多,這也是人類已往能夠在圍 棋上保持對對電腦優勢的關鍵因素。然而深層學習獲得了「感覺」,讓人類失去原本的優勢,也讓最後的堡壘忠告淪陷。

深層學習的另一個特徵是「無法說明究竟是如何學會」。雖說學會「無法說明的能力的過程,必定更無法說明,這個現象也讓某些電腦程式師困惑不已。

深層學習的過程首先必須輸入大量資料,接著程式便會自行整理資料,形成對資料的各種認知,不過這些認知究竟是如何形成的,實際上無跡可尋。

對於程式師來說,電腦應該是照指令行動的東西。以開車為例,自己開的車必須能百分之百照自己的意思操縱才能安心,有時只要輪胎稍微一滑,任何一位駕駛

都會捏把冷汗。若車子能深層學習,隨自己的經驗自己跑,睡醒時驚覺已經幫你開到目的地,就算結果不錯,也一定有人不喜歡這樣的車子。

我們可以預料,未來有些工作會逐漸轉由AI代勞。不過AI的認知和人類會有所差異,也一定有人類難以預測的部分。雖說學習無法說明的能力的過程,也必定無法透明,只要人類繼續使用深層學習技術,這個問題也將永遠存在。

作者:王銘琬
1961年11月22日生,四歲開始學圍棋,1975年11月赴日。1977年入段。1979年獲第3期留園杯冠軍。1980年、1981年獲棋聖戰三段戰冠軍。1984年獲「新人獎」,1985年獲殊勛獎。共4次入圍名人戰循環圈。1986年獲棋聖戰六段戰冠軍。1987年獲棋聖戰七段戰冠軍。1989年、1991年獲俊英戰桂冠。1991年獲棋聖戰八段戰冠軍。1992年九段。2000年在第55期本因坊戰中以4:2勝趙善津奪得本因坊位。2001年在第56期本因坊戰中以4:3勝張栩衛冕本因坊。2002年贏得日經舉辦王座至高榮譽。

譯者:林依璇

台大法律系學士,台大國家發展研究所碩士,現就讀政大法律系博士班。

出版:大塊文化(9/28上市)

延伸閱讀:
書摘》棋士與AI ── AlphaGo開啓的未來(上)

面對AlphaGo帶來的變化,首當其衝的知名職業棋士,正是參與圍棋軟體開發的王銘琬。他眼中的AlphaGo,究竟是何種面貌呢?   圖/大塊文化

2016年3月王銘琬與趨勢團隊(左起Ricky,張明正,王銘琬,Pacha,Ted,Charles)。