本文重點
- 來自台灣的工程師黃士傑是AlphaGo的關鍵開發者,他從小熱愛圍棋,在台灣完成學業後加入DeepMind,成功開發出震驚世界的AI圍棋系統。
- AlphaGo在2016年擊敗世界冠軍李世乭,標誌著AI在複雜策略遊戲中超越人類。這一突破為AI發展開闢了新的可能性。
- 黃士傑及其團隊持續推進AI技術,從圍棋延伸到其他領域。AlphaGo的成功為通用AI的發展奠定基礎,有望解決更多人類面臨的挑戰。
在全球上億觀眾面前,DeepMind研究員黃士傑輕輕地放下一枚黑子,這一手將成為人工智慧史上的傳奇。
坐在他對面,代表人類出戰的是地表上最強的圍棋高手,曾拿下18次世界冠軍的韓國九段棋士李世乭(Lee Sedol)。他驚訝不解地瞪著棋盤,接著像洩了氣的皮球,往後一靠,開始無意識地拉下唇,指甲不停地摳著手背。
評論員告訴觀眾:「我不知道這是一步好棋,還是爛棋。」另一名評論員,美國圍棋協會的副會長更直接說:「這下錯了吧。」
因為,從來沒有「人類」這樣下過。
15分鐘後,他終於出手,但大勢已去,全世界看著他被逼入絕境,四小時20分鐘後,他認輸。
最後,大家都知道了,AlphaGo以四勝一敗獲得壓倒性勝利。
科幻小說不是沒寫過,但眾多AI專家和圍棋界以為至少還要幾十年,機器才有可能打敗人類圍棋大師。這天,來的太快。
AlphaGo與李世乭(右)圍棋對戰,被稱為「AlphaGo之父」的黃士傑(左)扮演關鍵角色。圖片來源:截自Google DeepMind影片
賽前,李世乭曾自信能輕鬆以直落五打敗AlphaGo,「我認為人類的直覺仍是機器難以企及的,我將盡力捍衛人類的智慧。」三連敗後,他艱難地承認:「我誤判了AlphaGo的能力,我感到無能為力。」三年後,李世乭黯然宣佈退休。
有人為李世乭的戰敗哭泣,也為人類哭泣。我們以為人類與眾不同的複雜思辨能力,不再是我們獨有,還遭到機器的無情碾壓。李世乭被視為烈士,第37手是人類落敗的恥辱柱,而代AlphaGo執子的黃士傑,「他一直面無表情,連一次廁所都沒去⋯⋯我甚至覺得,黃士傑或許就是AlphaGo的本體。」李世乭賽後回憶。
黃士傑或許是AlphaGo的手,其大腦的建築師之一,甚至有人稱他為「AlphaGo之父」,但他絕非機器,而是一個從小愛下圍棋的台灣囝仔。
1997年「深藍」打敗世界棋王卡斯巴羅夫時,他正在準備高中聯考。當時,電腦打敗人類圍棋大師仍是個遙遠的夢。交大資工畢業、台師大資工碩博十年,他從沒喝過洋墨水,俗稱「土博」。
他在博班期間共同成立了台師大圍棋社,人稱「Aja學長」。棋力業餘六段的他,會幫社員們擬對戰分組表,還原戰場並解說,帶學弟妹征戰。
他的指導教授林順喜也是位「土博」,用大半研究經費,鼓勵學生出國比賽交流。在比賽中,黃士傑遇見了另一位恩師,法籍的電腦圍棋界大師雷米・庫洛姆(Rémi Coulom),冠軍圍棋軟體「Crazy Stone」的開發者。
Coulom是當時圍棋程式最強的人。黃士傑記得,第一次試著跟他搭話時,對方很沉默,一直盯著螢幕看。
儘管一口破英文,黃士傑也不怕。「他們聽不懂,我就『pardon?』(意指再說一次),再講一次就好。」黃士傑曾告訴《商業周刊》。
自嘲「臉皮厚」的黃士傑,賽後開始寫信給庫洛姆,請教論文中不懂之處,一來一往,竟為自己找到博論共同指導教授和合作者。他們共同開發了「Erica」——AlphaGo的前身,黃士傑以妻子的英文名字命名。
2010年,Erica擊敗當時世界第一的圍棋軟體「Zen」,奪下電腦奧林匹克競賽「19路電腦圍棋金牌」。同月,DeepMind在倫敦成立。
兩年後,DeepMind挖角,黃士傑成為該公司編號第40號員工。再兩年,Google以四億美元(約新台幣128億元)收購DeepMind。
黃士傑在Google DeepMind裡,負責研究AlphaGo與AI運用。圖片來源:天下雜誌
AlphaGo是進Google後才有的案子。第一年「團隊」只有黃士傑和一個實習生,他一個人埋頭寫程式。「不知道行不行,如果不行,就要收起來。」他曾告訴《商業周刊》。
轉機發生在黃士傑開發出策略網絡(Policy Network)之後,棋力飆升,對弈原始版本的勝率竟然高達100%。執行長決定投入人力,AlphaGo正式成軍,時間是2015年3月。
什麼是策略網絡?
李世乭說,人類的直覺,是機器難以趕上的。策略網絡就是要訓練機器的直覺。
直覺如何訓練?幾乎所有的學習,都始於模仿。策略網絡就是先灌入逾十萬本武林祕笈,再利用深度神經網絡,訓練AlphaGo模仿棋譜中的高手過招。這個「直覺」,將指引樹狀搜尋,從3,000萬步棋路中快速選出最佳落點。
接著上場的是「價值網絡」(Value Network),訓練其「判斷」,分析局勢,預測各落子處的勝率,試圖最大化勝率。
透過不斷自我對弈強化學習,AlphaGo在數月內快速脫胎換骨。
七個月後,AlphaGo以5:0打敗歐洲棋王樊麾;五個月後,再敗世界棋王李世乭。接著,在中國戰勝了五位世界冠軍組成的明星隊。
彷彿還不過癮,那年底,黃士傑關在台南家中的房間,創了一個名為「Master」的帳號,在網路上殺遍世界50多名頂尖高手,60局完勝,血流成河。有網友暱稱這名神秘高手為圍棋界的「獨孤求敗」。60勝後,有人問他究竟是何方神聖?Master打下這些字:「我就是AlphaGo的黃博士!」
然而,血洗武林後,AlphaGo在2017年底宣佈封刀,不再出賽。黃士傑在臉書上發表臨別感言,AlphaGo轉型教學工具,他已轉至其他專案。
不久前,Google剛宣佈AlphaGo Zero的誕生。
誕生36小時後,Zero就以100:0的全勝戰績,碾壓打敗李世乭的AlphaGo Lee;誕生第21天,就打敗血洗武林的Master。
更可怕的是,相較於「吞了」3,000萬棋譜的AlphaGo,AlphaGo Zero強調零添加,零棋譜,全靠自己摸索。三天內,左右手互搏490萬次。
這是一種新型的強化學習,神經網絡從千百萬場的自我對奕中,淬煉出形勢判斷力,精準預測下一手棋、及其最終勝率,最終打造出更強的自己。
DeepMind說,這套方法,比過去任何版本的AlphaGo都強,「因為它已經不再受到人類知識的限制」。
真正的,以無招勝有招。
近年黃士傑已不再受訪,最後一次公開現身台灣,是在2020年的人工智慧年會上。當時,AlphaGo的後代已先後攻克傳統AI難以致勝的雅達利(Atari)電玩、即時策略遊戲星海爭霸II。
但黃士傑說:「我們的目標,是要打造通用AI,來協助人類解決世界上的難題。」
七月底,黃士傑在臉書上公佈,AlphaProof和AlphaGeometry 2在今年的國際奧數競賽中奪銀,與金牌僅一分之差,是國際奧數史上首個奪牌的AI。「顯示AlphaGo這條路線的方法在科學領域的潛力,」黃士傑說。
除了科學領域,DeepMind執行長哈薩比斯(Demis Hassabis)去年中告訴《連線》(Wired)雜誌,他們結合了AlphaGo和大型語言模型,打造通用AI系統Gemini,要跟ChatGPT爭鋒。 從只會下圍棋,到打電動、拼奧數,到能開車、寫詩、畫畫、設計新藥、搞科學研發,結合機器人,未來還能做更多事。
AlphaGo在九年間,走出了人類當初難以想像的路。
2024年回首,黃士傑說,這是他離開台灣到英國追夢的第12年,「在這12年間世界有了很大的變化,AlphaGo也完成了我人生的夢想,儘管未來還有許多不確定性,AI的發展還會不斷前進。」
小檔案|黃士傑
Google DeepMind研究員黃士傑。圖片來源:天下雜誌 圖片設計:未來城市
- 出生年:1978年
- 現職:Google DeepMind 研究員
- 學歷:師大資工所博士
- 經歷:加拿大阿爾伯塔大學(University of Alberta)博士後研究員
- 榮譽:奧林匹亞電腦遊戲程式競賽圍棋冠軍
延伸閱讀
深度專題
「AI即國力」在2024年已成共識。進入新時代,天下「未來城市」推出了「台灣AI 20」專題報導,邀請產官學代表組成推薦委員會,選出20位在AI的技術創新、產業應用、政策推動、知識教育和社群連結五大領域中,選出20位對台灣AI發展有重大影響的人物。
誰是台灣AI 20人物?他們為台灣做了哪些事?立刻點擊閱讀「台灣AI 20」深度專題。





