使世界看到台灣、讓人類驚艷AI的棋手工程師　黃士傑：打造解決難題的AGI

黃士傑研究電腦圍棋程式AlphaGo與AI應用，他期待以通用AI幫助人類解題。圖片來源：天下雜誌

2024-09-06

整理、撰文・王茜穎

12251

2016年三月十日，韓國首爾四季酒店，人類與機器的世紀對決進入第二局。目前人類戰績：零勝一敗。

本文重點

來自台灣的工程師黃士傑是AlphaGo的關鍵開發者，他從小熱愛圍棋，在台灣完成學業後加入DeepMind，成功開發出震驚世界的AI圍棋系統。
AlphaGo在2016年擊敗世界冠軍李世乭，標誌著AI在複雜策略遊戲中超越人類。這一突破為AI發展開闢了新的可能性。
黃士傑及其團隊持續推進AI技術，從圍棋延伸到其他領域。AlphaGo的成功為通用AI的發展奠定基礎，有望解決更多人類面臨的挑戰。

在全球上億觀眾面前，DeepMind研究員黃士傑輕輕地放下一枚黑子，這一手將成為人工智慧史上的傳奇。

坐在他對面，代表人類出戰的是地表上最強的圍棋高手，曾拿下18次世界冠軍的韓國九段棋士李世乭（Lee Sedol）。他驚訝不解地瞪著棋盤，接著像洩了氣的皮球，往後一靠，開始無意識地拉下唇，指甲不停地摳著手背。

評論員告訴觀眾：「我不知道這是一步好棋，還是爛棋。」另一名評論員，美國圍棋協會的副會長更直接說：「這下錯了吧。」

因為，從來沒有「人類」這樣下過。

15分鐘後，他終於出手，但大勢已去，全世界看著他被逼入絕境，四小時20分鐘後，他認輸。

最後，大家都知道了，AlphaGo以四勝一敗獲得壓倒性勝利。

科幻小說不是沒寫過，但眾多AI專家和圍棋界以為至少還要幾十年，機器才有可能打敗人類圍棋大師。這天，來的太快。

Google DeepMind-AlphaGo-AI 20 Taiwan-電腦圍棋-人工智慧-策略網路-Master-黃士傑-深度學習-AGI AlphaGo與李世乭（右）圍棋對戰，被稱為「AlphaGo之父」的黃士傑（左）扮演關鍵角色。圖片來源：截自Google DeepMind影片

賽前，李世乭曾自信能輕鬆以直落五打敗AlphaGo，「我認為人類的直覺仍是機器難以企及的，我將盡力捍衛人類的智慧。」三連敗後，他艱難地承認：「我誤判了AlphaGo的能力，我感到無能為力。」三年後，李世乭黯然宣佈退休。

有人為李世乭的戰敗哭泣，也為人類哭泣。我們以為人類與眾不同的複雜思辨能力，不再是我們獨有，還遭到機器的無情碾壓。李世乭被視為烈士，第37手是人類落敗的恥辱柱，而代AlphaGo執子的黃士傑，「他一直面無表情，連一次廁所都沒去⋯⋯我甚至覺得，黃士傑或許就是AlphaGo的本體。」李世乭賽後回憶。

黃士傑或許是AlphaGo的手，其大腦的建築師之一，甚至有人稱他為「AlphaGo之父」，但他絕非機器，而是一個從小愛下圍棋的台灣囝仔。

1997年「深藍」打敗世界棋王卡斯巴羅夫時，他正在準備高中聯考。當時，電腦打敗人類圍棋大師仍是個遙遠的夢。交大資工畢業、台師大資工碩博十年，他從沒喝過洋墨水，俗稱「土博」。

他在博班期間共同成立了台師大圍棋社，人稱「Aja學長」。棋力業餘六段的他，會幫社員們擬對戰分組表，還原戰場並解說，帶學弟妹征戰。

他的指導教授林順喜也是位「土博」，用大半研究經費，鼓勵學生出國比賽交流。在比賽中，黃士傑遇見了另一位恩師，法籍的電腦圍棋界大師雷米・庫洛姆（Rémi Coulom），冠軍圍棋軟體「Crazy Stone」的開發者。

Coulom是當時圍棋程式最強的人。黃士傑記得，第一次試著跟他搭話時，對方很沉默，一直盯著螢幕看。

儘管一口破英文，黃士傑也不怕。「他們聽不懂，我就『pardon？』（意指再說一次），再講一次就好。」黃士傑曾告訴《商業周刊》。

自嘲「臉皮厚」的黃士傑，賽後開始寫信給庫洛姆，請教論文中不懂之處，一來一往，竟為自己找到博論共同指導教授和合作者。他們共同開發了「Erica」——AlphaGo的前身，黃士傑以妻子的英文名字命名。

2010年，Erica擊敗當時世界第一的圍棋軟體「Zen」，奪下電腦奧林匹克競賽「19路電腦圍棋金牌」。同月，DeepMind在倫敦成立。

兩年後，DeepMind挖角，黃士傑成為該公司編號第40號員工。再兩年，Google以四億美元（約新台幣128億元）收購DeepMind。

黃士傑-DeepMind-AlphaGo-Google-人工智慧-圍棋-圍棋軟體-策略網路黃士傑在Google DeepMind裡，負責研究AlphaGo與AI運用。圖片來源：天下雜誌

AlphaGo是進Google後才有的案子。第一年「團隊」只有黃士傑和一個實習生，他一個人埋頭寫程式。「不知道行不行，如果不行，就要收起來。」他曾告訴《商業周刊》。

轉機發生在黃士傑開發出策略網絡（Policy Network）之後，棋力飆升，對弈原始版本的勝率竟然高達100%。執行長決定投入人力，AlphaGo正式成軍，時間是2015年3月。

什麼是策略網絡？

李世乭說，人類的直覺，是機器難以趕上的。策略網絡就是要訓練機器的直覺。

直覺如何訓練？幾乎所有的學習，都始於模仿。策略網絡就是先灌入逾十萬本武林祕笈，再利用深度神經網絡，訓練AlphaGo模仿棋譜中的高手過招。這個「直覺」，將指引樹狀搜尋，從3,000萬步棋路中快速選出最佳落點。

接著上場的是「價值網絡」（Value Network），訓練其「判斷」，分析局勢，預測各落子處的勝率，試圖最大化勝率。

透過不斷自我對弈強化學習，AlphaGo在數月內快速脫胎換骨。

七個月後，AlphaGo以5：0打敗歐洲棋王樊麾；五個月後，再敗世界棋王李世乭。接著，在中國戰勝了五位世界冠軍組成的明星隊。

彷彿還不過癮，那年底，黃士傑關在台南家中的房間，創了一個名為「Master」的帳號，在網路上殺遍世界50多名頂尖高手，60局完勝，血流成河。有網友暱稱這名神秘高手為圍棋界的「獨孤求敗」。60勝後，有人問他究竟是何方神聖？Master打下這些字：「我就是AlphaGo的黃博士！」

然而，血洗武林後，AlphaGo在2017年底宣佈封刀，不再出賽。黃士傑在臉書上發表臨別感言，AlphaGo轉型教學工具，他已轉至其他專案。

不久前，Google剛宣佈AlphaGo Zero的誕生。

誕生36小時後，Zero就以100:0的全勝戰績，碾壓打敗李世乭的AlphaGo Lee；誕生第21天，就打敗血洗武林的Master。

更可怕的是，相較於「吞了」3,000萬棋譜的AlphaGo，AlphaGo Zero強調零添加，零棋譜，全靠自己摸索。三天內，左右手互搏490萬次。

這是一種新型的強化學習，神經網絡從千百萬場的自我對奕中，淬煉出形勢判斷力，精準預測下一手棋、及其最終勝率，最終打造出更強的自己。

DeepMind說，這套方法，比過去任何版本的AlphaGo都強，「因為它已經不再受到人類知識的限制」。

真正的，以無招勝有招。

近年黃士傑已不再受訪，最後一次公開現身台灣，是在2020年的人工智慧年會上。當時，AlphaGo的後代已先後攻克傳統AI難以致勝的雅達利（Atari）電玩、即時策略遊戲星海爭霸II。

但黃士傑說：「我們的目標，是要打造通用AI，來協助人類解決世界上的難題。」

七月底，黃士傑在臉書上公佈，AlphaProof和AlphaGeometry 2在今年的國際奧數競賽中奪銀，與金牌僅一分之差，是國際奧數史上首個奪牌的AI。「顯示AlphaGo這條路線的方法在科學領域的潛力，」黃士傑說。

除了科學領域，DeepMind執行長哈薩比斯（Demis Hassabis）去年中告訴《連線》（Wired）雜誌，他們結合了AlphaGo和大型語言模型，打造通用AI系統Gemini，要跟ChatGPT爭鋒。從只會下圍棋，到打電動、拼奧數，到能開車、寫詩、畫畫、設計新藥、搞科學研發，結合機器人，未來還能做更多事。

AlphaGo在九年間，走出了人類當初難以想像的路。

2024年回首，黃士傑說，這是他離開台灣到英國追夢的第12年，「在這12年間世界有了很大的變化，AlphaGo也完成了我人生的夢想，儘管未來還有許多不確定性，AI的發展還會不斷前進。」