AI版「東大特訓班」機器人小東君落榜 數學超強但__太弱

AI版「東大特訓班」機器人小東君落榜  數學超強但__太弱
東京大學圖片來源:Shutterstock
2019-10-29
文.林倞、周芷羽
17253
機器人「小東君」(東ロボ君)是2011至2016年間,由日本國立情報學研究所主導、東京大學負責開發的人工智慧;目標是從日本大學入學考試中,拿到足以考取東京大學的成績。

儘管2013年,小東君在已達到能夠考取日本前段班公私立大學部分科系的能力,但「閱讀理解力」一直無法突破現今人工智慧演算法的極限,因而在2016年放棄考取東大的目標,計畫中止。

以下將透過小東君計畫成員,新井紀子博士所著的《人工智慧 vs 無法閱讀教科書的孩子們》(AI vs 教科書が読めない子供たち),來理解該計畫成果以及研究人員開發心得。此書為其出版社——東洋經濟新潮社2018年度暢銷書籍。

新井紀子自一橋大學獲得法律學位後,於伊利諾大學數學系修畢專業博士課程,其後取得東京工業大學理學博士學位;至今出版日文書籍達20本以上,先後受邀於知名知識分享平台TED與聯合國演講。2011年成為小東君開發計畫——「機器人能考進東京大學嗎(ロボットは東大に入れるか)」的負責人;小東君計畫終止後,2016年開始主導診斷(日本中學生)讀解能力的研發計畫。

本書重點有三:

(1) 現今已知人工智慧技術不會進化到具有思考能力;

(2)政府應改變思維模式來因應AI時代;

(3)人力危機來臨:AI技術的程度已足以勝任多數人類的工作,而現今教育制度不符合AI時代的需求。

「AI技術」不等於人工智慧

作者首先釐清「真正」的人工智慧,與至今為了有朝一日實現人工智慧的過程中所發展出來的技術間的區別:人工智慧,指的是能通過圖靈測試(Turing test),而讓人猜不透是真人或假人的電腦;至今已知的深度學習等演算法,則只是過程中所發展出來的技術。

些技術被作者定義為「AI技術」,不應與AI直接混為一談。嚴謹區分「AI」與「AI技術」的原因在於,至今已知的AI技術無法成為真正的AI,也就是電腦能像人類一樣思考、且比人類更聰明的那個時間點(奇點,singularity),不會由已知的AI技術獲得。

目前已知「AI技術」之所以無法進化為「AI」,是因為即使是模擬「神經元」的資訊傳導模式發展出來的演算法(如深度學習等),其運作模式更接近無腦生物(如海星)的神經元,遑論從無腦生物再到會思考的人類大腦間,運作機制還有多大的差異。甚至,人類的智慧究竟是怎麼運作,現在也無法用科學方法觀察。

「小東君」數學最好,語言最差

上述結論,是開發小東君的這幾年間所獲得的。日本大學入學考試利用「偏差值」來推測考生的成績落點,總體考生分數平均值的偏差值為50,取得65的考生屬頂尖的一群。小東君的偏差值在57.1,已可以考上明治大學、青山學院大學、立教大學、中央大學、法政大學等,依發音字首並稱為「MARCH」的日本前段班公私立大學的部分科系。

在不同學科表現方面,小東君的數學成績最為突出,偏差值達76.2;日本史、世界史的正確率亦有75%。答題策略上,小東君回答數學科目時,可以將題目分解成好幾個關鍵字之後,建立數種解題模式再進行分析;其他科目也是將每道題目及其選項都當作填充題拆解,找出最正確敘述。

決定小東君無法「考上」東大的關鍵因素,在於日語與英語等語言相關科目,小東君的偏差值都在50上下,距離東大偏差值至少77的門檻,有相當大的距離。

問題就在於小東君不會真正的「思考」,它只會算選擇題每一個選項的正確機率,無法真實的透過「理解」問題,進行回答。一旦語言科目的題型從單一句子的排列組合,變成對話文中的句子重組,小東君的答對率就從84%掉到33%。

只要「AI技術」的演算法沒有新的突破,日本即使有世界最強大的超級電腦「京」這樣的硬體,還是無法創造出真正能思考的「AI」。

【延伸閱讀】AI為何還是取代不了放射科醫師?

日本製造業起家,限制AI技術發展

政治環境方面,新井紀子認為「第五代電腦計劃」的失敗,是日本政府近期AI政策相對保守的原因。

1982年,日本通商產業省(現在經濟產業省前身)主導了經費約500億日圓的第五代電腦計劃,想透過「邏輯論證」式的演算法,來達到自動診斷和機器翻譯的目標。

邏輯論證式AI技術與目前主流AI技術的差異在於,主流AI技術是「統計機率」式演算法,可容許問題與解答間具有更模糊的關係,能夠解決更複雜的問題,較為實用。

第五代電腦計劃最後失敗收場,然而作者卻遍尋不到通產省的正式檢討報告;這種失敗又不正面承認的心理,導致日本對AI研發的態度相當保守。

在美國,光是IBM一家企業就投下10億美元研發人工智慧「Watson」,而全日本加起來,卻只有小東君這麼一個大規模研發計畫而已。

經濟環境方面,新井紀子認為,日本以製造業為主的國家發展模式,造成對AI技術發展的限制。

日本是以製造業為發展基礎的國家,企業文化上要求品質與精確度,比較不會投入獲利不確定性高的研發。日本既已經發展出最先進的自動化工廠,便不想冒險使用判斷過程中可能造成重大事故的統計機率式AI技術,這跟Google和Facebook這類「服務業」的思維,完全不同。

Google和Facebook提供的無償服務,因演算法失誤造成損失的風險相對就非常低,所以主流AI技術才會從美國萌芽,發展到今天的程度。

【延伸閱讀】該叫「小王」、「王先生」還是「王董」?其實,人工智慧的判斷沒你準

AI技術贏過多數人類

新井紀子認為,AI技術的發展將造成失業率提升。20世紀初工廠引進傳動帶之後,工廠進入初階自動化階段,事務作業增加,白領階級開始出現;但直到大學普及、白領階級大量增加之前,已有很多工廠勞動者失業,成為大蕭條的遠因。

這批失業者,就是未能達到白領階級所需的技能與知識,無法馬上進入新勞動市場的勞動者。隨著AI的出現,當時的情景已經在這世界重演。

新井紀子提出的危機有二:

(1)AI技術在某些領域贏過人類

即使小東君考不上東大,它的大學入學考試成績,還是超越了80%的50萬應考生。這暗示著在未來與該等學科相關的工作崗位上,可以無限複製的AI技術,能夠取代多數的白領階層。

(2)AI技術未勝出的領域

從小東君計畫所看到的AI技術極限,可說是人類的福音。AI技術所無法取代的人類特質,包括溝通能力、能理解對話重點、創意、不受限於框架的自我思考等;但AI技術做不來的工作,多數人類可能也無法勝任,這種現象從日本目前的就業市場及國高中教育都能看到端倪。

學用落差是日本目前就業市場的問題所在。在過去日本經濟高度成長的時代,升學率不高,日本企業傾向以在職培訓制度,長期培訓員工;企業甚至不信任大學教育,將大學學位當作篩選人才的篩子。

既然對人力資源投入大量成本,終身雇用、依年資敘薪便成為過去日本職場的常態。但隨著市場環境變化的加速,剛擬好的培訓內容可能馬上就跟不上需求;在職訓練衰退,企業開始希望大學能培養出擁有即戰力的社會新鮮人,但往往不符預期,形成惡性循環。

這個惡性循環的結果是,企業傾向以較低的薪資僱用有經驗但已退休,或是其他任期制的非正式員工,使得日本的薪資中位數一直無法回復多年前的水準。

日本國中畢業生1/3無法閱讀文章

目前日本社會充斥著失業或任期制就業人口,但企業想找人卻找不到人,意味就算出現新產業、新職缺需求,但有能力勝任的人數依舊不足。日本學子在閱讀能力上的不足,讓小東君計畫研究人員感到憂心。

日本國立情報學研究所在小東君計畫後,開始反思其國內學子是否具有AI技術不可替代的閱讀能力。

日本國高中生閱讀能力的調查報告顯示,國中畢業階段,三人之中就有一人無法閱讀簡單的文章。就算是中段程度的學校,也有半數以上學生無法在閱讀文章後做出摘要。升學率100%的學校,也只有近50%的學生能正確理解文章並做出摘要。國中生的讀解能力值平均雖有成長,但在高中時代就陷入停滯。更令人同情的是,讀解能力值與家庭經濟狀況呈現負相關。

新井紀子認為,日本的教育必須轉型,至少要讓學生讀懂教科書的文句敘述,否則根據小東君的表現,有80%的高中生未來將面臨被取代的危機。

政府扶植產業不見得是好事

以下筆者將透過先前AI程式操作經驗,並整合其他學者的觀點及文獻上的證據,從上述AI極限、政經環境、人力危機三個主題切入,來理解、討論此書內容。

(一) 面對AI極限——塞翁失馬焉知非福

關於「目前已知AI技術無法進化成真實會思考的AI」,從對AI的發展有所期待的角度來看,確實讓人有些失望。但這一方面也留給科學家更多的研究空間,去發明新的演算方法。

從過去可能走進死胡同的邏輯論證式AI技術,再到近年蓬勃發展的統計機率式AI技術,人類不斷把人工智慧向前推進;對於看到通過圖靈測試的AI的那一天,依舊是值得保持樂觀的。但若「奇點」不會到來,卻也突顯了人類在宇宙中存在的難能可貴。

(二) 改善政經環境——放任的智慧

政府的思維,應在扶植產業與自由放任間取得平衡。新井紀子觀察到的「美國一家企業就能抵得上日本傾全國之力在AI技術的投資」只是表象,「日本以製造業為主的國家發展模式,造成對AI技術發展的限制」等才是造成表象的原因。

一個國家從政策面就制定了以製造業為主的國家發展模式,以國家資源枎植特定產業,就會抑制未知前景的新創產業自由生長茁壯的機會。

其實,台灣政府過去在扶植產業的成效卓著,不論是半導體產業或後來的顯示器產業,都帶動了經濟發展與就業機會;但扶植產業真的是最佳解嗎?民選政府一方面無可避免必須回應人民的期待、有所做為,但還是得在放任自由經濟間進行權衡。就像台積電前董事長張忠謀引述的名言:「最可怕的話是『我來自政府,我是來幫忙的。』(The nine most terrifying words in the English language are “I'm from the government, and I'm here to help.”)。」

全球暢銷書《黑天鵝效應》提出了一個非常重要的觀點:改變歷史的「黑天鵝」,往往是不可預期、發生機率極低的事件,人類又會在「事後」自以為是地提出一套自圓其說的道理,來解釋「黑天鵝」。

Google和Facebook這類服務業的出現就是「黑天鵝」,任何人對其創業成功原因的解釋都是事後諸葛。美國政府成功之處,就是營造自由氛圍,放任地讓「未知前景」的新創產業自由生長茁壯。即使中樂透的機率極低,只要一個國家發行樂透彩券,一年內有人中樂透的機率就會變成100%;美國的自由氛圍就好比讓人有中樂透的機會,使得Google等企業的出現,就會像總有人中樂透一樣,機率大幅提升。

(三) 解決人力危機—終身學習的文化氛圍

證據顯示技術發展與經濟蕭條無關。雖然新井紀子提到技術的進步可能是1930年代經濟大蕭條的遠因,但也有研究證據指出,技術進步並大蕭條的原因,當然也跟當時的失業率飆升無關。而技術進步帶來了經濟繁榮,則是一般的經濟學認知。

但回到AI技術本身,甚至是回到現代歷史中不斷發生的技術進步本身,不可否認的是,新井紀子提出的警訊,是其他經濟學家也在示警的。

其實不需要未來AI技術的介入,就業機會外移、待業人口不符產業需求等議題,現在就已時常出現在台灣新聞版面了;我們面對的不會是AI技術造成的人力危機,而是現在就已經在面對、當下正尋求解決方案的危機。

而人力危機的解決方案,不應限縮在培養具有理解閱讀能力的「學生」,而應著重在培養「好學的社會人士」。

學生時代只占一個人一生非常短的時間,只要教育制度能讓多數人在步出校園後依然樂於學習、成長,即使學生時代閱讀理解能力不足,在踏入社會這麼長的時間裡,好學的人總會開竅,使AI無法取代。

若為了在短時間讓學生學會某種「能力」,揠苗助長,很可能讓多數人學習成就感低落,而在更長的人生裡失去對學習的興趣,反而減少了國家中具有理解閱讀能力的人口總數。

從現實不難發現,台灣最成功的企業家如王永慶、許文龍、郭台銘等,無須傲人學歷,就能改變國家的經濟發展,他們的能力肯定是AI無法取代的。成功者即便沒有漂亮學歷,也能在社會上磨練出新井紀子所說「AI技術所無法取代」的人類特質。

台灣與日本面臨類似窘境

日本的政經環境及人力危機,與台灣有許多相似之處。例如以製造業為主的國家發展模式,可能不利於Google這樣的知識服務企業壯大,或是學用落差、薪資停滯不前、教改成效等,都顯示了日本—這個我們常視為榜樣的國家,跟台灣面臨到許多一樣的社會問題。

當我們想要學習美國AI技術成功模式的時候,也必須考量到,不論是市場規模、文化等政經環境,每個國家都是獨一無二,而且魚與熊掌不可兼得;政府過去主導以製造業為主的國家發展方針,造就了現在日本、台灣的成就,但也相對壓縮了未知前景的新創產業自由生長茁壯的機會。政府可以思考如何在扶植產業與自由放任間,取得平衡。

培養國民溝通能力、能理解對話重點、創意、不受限於框架的自我思考等,AI技術所無法取代的人類特質固然非常重要,但不應把培養過程限縮在學校教育。以台灣許多沒有受過高等教育的成功企業家為例,他們都能夠在出社會後持續培養出AI所不可取代的特質,所以讓全民養成終身學習的習慣,應是教育改革更有意義的方向。(本文獲財團法人國家實驗研究院科技政策研究與資訊中心授權改寫、轉載,原文標題為東ロボ君的啟示—人工智慧現況與人類教育反思

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結