AGI通用型人工智慧是什麼？9派定義與6個等級

Google Deepmind的論文中提出「AGI六大原則」，分級與定義了AGI。圖片來源：Shutterstock

2023-12-04

文・大風吹微濕（VIVE後浪潮）

22910

OpenAI執行長Sam Altman最近在《金融時報》採訪時透露，為了接下來「通用人工智慧」（Artificial General Intelligence，AGI）的發展，他正在跟微軟爸爸爭取更多的資金。看來，AGI似乎已經成為各方AI角逐者的終局目標。

只是，AGI究竟是什麼呢？好巧不巧，前陣子Google Deepmind發表一篇名為〈通用人工智慧等級：實現通往AGI之路的進展〉（Levels of AGI: Operationalizing Progress on the Path to AGI）的論文，試圖重新定義這個顯得既氾濫又模糊的名詞，為AGI提供了一個更為實際且更有助於討論的全新框架。

AGI的9派定義與局限

起先，我也和大家一樣大惑不解，為何要幫AGI分等級？《幽游白書》真人影集預告才剛釋出，難不成這是受到日漫影響，妖力S級、A級⋯⋯之類的？仔細看了看論文，才發現Deepmind拿出「自駕等級」類比，就像國際汽車工程師學會（SAE）在2021年提出的自動駕駛分級，是從「駕駛輔助」到「完全自動」一共分作L1至L5五級，AGI也應該理當分級才是。嗯，確實有幾分道理。

在武斷地做出AGI的等級區分之前，Deepmind的論文先對過往AI大大們所提出的「AGI定義」進行一番指點和討論，來了一場禮貌大回顧。

圖靈測試

先從最OG的「圖靈測試」（Turing Test）回顧起。圖靈在1950年發表了劃時代論文，預言人類創造出具備智慧的機器的可能性。由於難以確切定義出何謂「智慧」，因此他提出了圖靈測試——也就是一台能與人類對話、並且不被辨別出機器的身分，那就通過了圖靈測試。

但眾所皆知，如今包括GPT在內的許多LLM都已經通過了圖靈測試。但很顯然，它們都還不算真正的AGI。

圖靈-圖靈測試-Turing Test-Turing-AI-AGI-通用型人工智慧-人工智慧-LLM 圖靈藉由「圖靈測試」，判斷機器的智慧能力。圖片來源：Wikipedia

強AI：擁有意識的系統

「強人工智慧」（Strong AI）是哲學家約翰塞爾（John Searle）提出的概念，他認為在經過適當的編程並賦予正確的程式之後，電腦也算是擁有思維。但某種程度來說，把AGI的構成條件推往更難被定義的「意識」，反倒更難進行討論。

人腦類比

AGI一詞最早出現在馬克古布魯德（Mark Gubrud）在1997年的軍事技術的文章，他定義AGI是「在複雜性和速度上媲美或超越人腦的AI系統」。但Deepmind的論文指出，就算現代機器學習和神經網絡的確受到人腦的啟發，但未必就代表AGI得依照人腦的模式發展。

認知任務達人類水準

這個AGI定義聽起來蠻合理——直到生成式AI的出現。

何謂認知任務？簡單來說，就是非體力活的工作。可是，ChatGPT或Midjourney等工具都已經達到人類的水準了啊。那是不是能說，現在AI已經達到通用人工智慧的等級了呢？（打完收工）

學習能力

倫敦帝國理工學院認知機器人學教授沙納漢（Murray Shanahan）在他的著作《科技奇點》（The Technological Singularity）提出：「AGI是一種不專門執行特定任務的AI，而是能夠學習並執行與人類一樣廣泛任務的AI。」他的AGI框架，更強調了學習和通用的重要性。

沙納漢-AGI-Murray Shanahan-ChatGPT-通用人工智慧-科技奇點-The Technological Singularity 沙納漢指出，AGI的學習及通用性非常廣泛，並不局限於單一領域。圖片來源：沙納漢網站

具備經濟價值的工作

根據OpenAI2018年的憲章定義，AGI指的是「在大多數經濟價值工作中超越人類的高度自動系統」。但Deepmind論文認為這個定義有點狹隘，畢竟有許多與智慧相關的工作，並沒有明確的經濟價值，比方說藝術和創造類的工作。

靈活與通用：咖啡測試與其他挑戰

另一位認知心理學科學家、前陣子才狂嗆圖靈獎得主楊立坤（Yann LeCun）的馬克思（Gary Marcus）也有自己的AGI定義。他認為，AGI指的是在靈活性和通用性都具備了相當於或超越人類智慧的AI，他一共列出了五項任務類別，從看懂電影，到會在任何的廚房裡做飯。

Deepmind論文說，這很類似於蘋果的另一位創辦人沃茲尼克（Steve Wozniak）曾提出的「咖啡測試」，指的是通用人工智慧，得到任一個美國家庭，找到咖啡機、找到咖啡豆、加水、找到杯子、到按下正確的按鈕，最終泡好一杯咖啡才算合格。

咖啡測試-沃茲尼克-Steve Wozniak-Deepmind-apple-蘋果-AGI 沃茲尼克提出的「咖啡測試」，可考驗AGI的通用性、靈活性。圖片來源：Woz.org

人工「能力」智慧

另一位AI大咖，Deepmind創辦人、現又創立Inflection AI，在搞另一個聊天機器人Pi的蘇萊曼（Mustafa Suleyman），今年也出版了新書《即將到來的浪潮》（The Coming Wave）。裡頭提出人工能力智慧（Artificial Capable Intelligence，ACI）的概念，更著重在AGI能做什麼，指出是「具有足夠能力和通用性，以完成開放世界的複雜、多步驟任務的AI系統。」

他還提出他版本的「現代圖靈測試」——他會拿出十萬美元給AI，假設AI有辦法在幾個月內翻成100萬美元（約新台幣3,150萬元）就算通過。（嗯，能做到我也服了。）（延伸閱讀｜AI有無限可能！OpenAI奧特曼與台裔主管陳信翰：下一代最幸運，別因別人嫌蠢就放棄【對談全文】）

蘇萊曼-AGI-Deepmind-Inflection AI-The Coming Wave-AI應用-人工智慧蘇萊曼提出，AGI應有足夠能力及通用性，可完成多步驟的任務。圖片來源：蘇萊曼網站

大型語言模型已是通才

兩位Google研究院的大神亞克斯（Blaise Agüera y Arcas）和糯米格（Peter Norvig）最近提出，目前較領先的大型語言模型（GPT-4、Bard、Llama 2、Claude）都已經算是AGI了。

他們認為，「通才」是AGI的關鍵屬性，而這些語言模型已經有足夠的通用性，比方可進行廣泛的討論、執行各種任務、處理多模態輸入輸出、多種語言操作等等。（延伸閱讀｜大型語言模型（LLM）是什麼？被用在哪6大場景？看懂6大重點）

6種AGI等級：從菜雞到超人

綜上所述，Deepmind論文接著歸納出更實用的「AGI六大原則」來進行AGI的分級與定義：

重點在於AI能做到什麼，而不是它如何做到
通用性和能力同樣重要
認知型任務與學習新事物的能力是衡量的標準
重點在於潛力而非部署
生態效度，也就是在真實世界的實用性很重要
關注在通往AGI的道路，而非單一終點

好的，如果你看到這邊已經逐漸恍神了，那不妨直接來看AGI的等級表吧！

通用性與能力

狹義（專才，特定任務）

廣義（通才，廣泛的非體力任務，包括學習新技能等後設認知能力）

Level 0：非AI

狹義非AI

計算機軟體
編譯器計算機軟體
編譯器

廣義非AI

人類訓練師計算，例如亞馬遜土耳其機器人

Level 1：新手

等於或略優於無技能的人類

新手級狹義AI

GOFAI
簡單基於規則的系統，例如SHRDL（Winograd,1971）

新手級AGI

ChatGPT（OpenAI,2023）
Bard（Anil et al., 2023）
Llama 2（Touvron et al., 2023）

Level2：熟手

贏過50%的有技能成年人

熟手級狹義AI

毒性檢測器，例如Jigsaw（Das et al.,2022）
智慧喇叭，例如Siri （Apple），Alexa（Amazon）或 Google Assistant（Google）
VQA系統，例如PaLI（Chen et al., 2023）
Watson（IBM）
可用於如短文寫作、寫簡單程式的現行大型語言模型

熟手級AGI

從缺

Level 3：專家

贏過90%的有技能成年人

專家級狹義AI

拼字和文法檢查器，例如Grammarly（Grammarly,2023）
圖像生成模型，例如Imagen（Saharia et al., 2022）、Dall-E 2（Ramesh et al., 2022）

專家級AGI

從缺

Level 4：大師

贏過99%的有技能成年人

大師級狹義AI

Deep Blue（Campbell et al., 2002）
AlphaGo（Silver et al., 2016,2017）

大師級AGI

從缺

Level 5：超人

超越所有人類

超人級狹義AI

AlphaFold（Jumper et al.,2021
Varadi et al.,2021），AlphaZero（Silver et al.,2018），StockFish（Stockfish,2023）

超人級AGI

從缺

人與AGI的關係：人類躺平，AI才可怕

既然這篇Deepmind論文是以「實用性」為出發點，那想必AGI的等級就不會只是列爽的。

AI熱潮以降不斷出現的各種AI威脅論，大家都是耳熟能詳；只是對話很難聚焦的原因，在於各方並沒有以相同的定義來作為討論的基礎。因此，這篇Deepmind論文就用了這個新框架，清楚地告訴我們，不同等級的AGI可能引發的風險與威脅。

自主性等級	範例	需解鎖的 AGI等級	導入風險與威脅
Level 0：非AI 人類做所有事	模擬方法（例如用鉛筆在紙上素描）非AI的數位工作流程（例如在文字編輯器中打字、在繪畫程式中繪圖）	非AI	零風險
Level 1：把AI當工具人類完全控制，只是用AI自動執行普通的任務	用搜尋引擎尋找資訊用檢查文法App修改寫作用機器翻譯App讀取圖示	新手級狹義AI 熟手級狹義AI	因過度依賴AI而失去技能破壞原有產業
Level 2：把AI當顧問當人類召喚時，AI能發揮實質的作用	依賴語言模型來進行文件摘要使用程式生成模型加入電腦程式編寫透過複雜推薦系統來消費娛樂	熟手級狹義AI 專家級狹義AI 新手級AGI	過度信任社會激化隱私成為目標被操控
Level 3：把AI當夥伴針對目標和任務互動協調，人類與AI平等協作	藉由與下棋AI對練，訓練成為西洋棋手與AI生成的虛擬人進行社交互動和娛樂	新手級AGI 專家級狹義AI 熟手級AGI	擬人化（例如，寄生社會關係，指忽略實體生活社交）快速社會變革
Level 4：把AI當專家主要由AI負責，人類提供指導和回饋	使用AI系統來推進科學發展（例如蛋白質折疊）	大師級狹義AI 專家級AGI	大規模的社會倦怠大規模勞力置換（例如失業）人類卓越性的殞落（人類的價值受到挑戰）
Level 5：把AI當代理人完全自主的AI	自主AI驅動的個人助理	大師級AGI 超人級AGI	AI與人類的價值對齊問題權力集中（得AI者得天下）