台灣要成「AI之島」？人工智慧學校校長孔祥重：先清政府資料、建產業模型、養技職人才

孔祥重認為，台灣先關注資料與人才兩大議題，才有機會成為「AI之島」。圖片來源：賴永祥攝

2024-03-18

採訪、撰文・陳芳毓

7296

採訪結束後，台灣人工智慧學校校長孔祥重坐在台北科技大學辦公室拍照。他看著身上外套的logo，彷彿想起什麼，「宏遠興業，是我跟昇瑋最早拜訪的幾家廠商。」

2017年，孔祥重帶著對台灣未來產業的憂慮，從哈佛大學學術休假返台。中研院院長廖俊智將這位地位崇高的資工學者，介紹給陳昇瑋——一位與他有著相同憂慮的年輕數據科學家。當時，陳昇瑋已連續舉辦四屆資料科學年會，最多曾吸引1,800人參加，是台灣最大的資料愛好者社群。

一位大學畢業即赴美深造的72歲學者，一位41歲的本土資訊工程新星，一拍即合。

孔祥重回憶，當時兩人每週都往中南部的工廠鑽，一家家拜訪、一遍遍介紹；在人們對AI半信半疑的年代，扛起台灣產業AI化的重擔。隔年，兩人在中研院支持下成立「人工智慧學校」，以每年上千人的速度，為台灣累積AI人才。

2023年，孔祥重再度趁學術休假回到台灣。七年過去，AI已從實驗室走進辦公室，生成式AI也正風起雲湧；儘管昔日戰友陳昇瑋已溘然長逝，但要做的事還更多，孔祥重仍舊馬不停蹄地奔波於企業、校園和政府之間。

「70年代個人電腦、90年代網路，都比AI革命小太多了！」這位78歲的學者興奮地滔滔不絕。他認為，AI將顛覆的不止是科技，而是各行各業，包含人文社會領域。「現在變化這麼快，資深的人有經驗，能幫的忙更大，退休就虧大了！」

焦點回到台灣。70年代個人電腦革命，帶起施振榮等台灣科技業第一批創業家，90年代網路革命，台灣也沒有缺席。這一次AI革命，台灣能扮演什麼角色？

去年12月的科技部「科技顧問會議」上，孔祥重當著國科會主委吳政忠、聯發科董事長蔡明介等左右台灣未來關鍵人物的面，提出六個國家戰略、共14個行動項目。「這是給政府的意見。行動，就是必須做的事。」

其中，資料與人才更是關鍵。

科技顧問會議-國科會-吳政忠-蔡明介-聯發科-蔡英文-陳建仁-行政院-人工智慧-人才-資料-政策-科技發展-台灣孔祥重（前排左三）出席2023年科技顧問會議，提供國家科技發展意見。圖片來源：行政院

以下為孔祥重的專訪重點：

我提出六個國家戰略的行動建議，其中兩個最重要，一個是資料，一個人才。

清整、開放、維護國家資料

資料是誰的責任？政府擁有的資料最多，所以政府要負很大責任。

理論上，政府每一項計畫、研究，都會產出資料，這些數據應該整理好，並且開放，讓台灣本土AI模型做訓練。但是，現在的政府資料出了什麼問題？

第一：原始資料（meta data）不明，是什麼樣的資料？何時搜集？是否經過整理？錯誤的資料是否清整？都不清楚。

第二：不知道資料放在哪，伺服器經常換。許多實驗產出數據，寫兩篇論文後，資料就不知放到哪去。

第三：授權規格不明。有沒有使用同意書？資料使否定期更新維護？

所以，儘管政府都說有資料，但只要資訊沒有整理到AI模型能用的程度，都不算真的資料。以這個標準來看，可用的政府資料其實很少。沒有資料，就做不出AI模型。

資料沒有清理、規範、定義、維護，也沒有編相關預算，就只能做表面的事；比如看到世界都在做大型語言模型，我們也要有反應，但做反應太容易了，真正困難的，是擁有本土資料。

有人說算力不夠，但這並非眼前的問題。如果有資料，算力可能不夠，但眼前的問題是連資料都還沒有。

清整資料後，政府資料應該開放給私人企業或研發人員使用。有資料可玩，人才才會有發展；沒有本土資料，怎麼做AI模型都難脫中國的影響。

部分私人資料若能開放，也私人機構也有好處。比如Google也放出許多資料，社群會用這些資料做出一些新東西，Google也會學到新作法。（延伸閱讀｜數位時代，台灣如何靠資料治理實踐海洋國家冒險精神？）

AI應用-數位發展-孔祥重-台灣AI-AI發展-人工智慧-生成式AI-國家資料-人工智慧-人才-資料-政策-科技發展-台灣孔祥重指出，台灣缺乏本土資料，AI發展難以邁開步伐。圖片來源：賴永祥攝

各行各業都要建立基礎AI模型

擁有台灣本土資料，就能做AI模型。通用資料可以做通用模型，給一般人用；專業領域資料，如製造業、醫療業，就做專業模型，給產業用，尤其是台灣最有優勢的半導體業。

我正與一家半導體公司合作，研究如何用生成式AI設計晶片，這能大幅縮短研發時間，快速推出新產品。例如，以前一個新想法，可能因為太貴、太耗人力，無法實踐，得拖上一、兩年。但生成式AI模型能疊加各種功能，把研發過程變得更快更容易。

理論上，每個領域都要做出自己的基礎模型，各企業就能在這個基礎上，用自己的資料做微調（fine-tune）。但做不出基礎模型，就只是土法煉鋼；雖然看起來很成功，但有經濟效益嗎？品質夠好嗎？未來能快速進步嗎？下一步就是真正的挑戰。

做出亮點AI專案不難，花錢、花時間就行。剛開始可以這樣起步，以後不行，這沒有規模，也做不好。就像文革時代，中國鋼的產量不夠，所以每個人民公社都在「煉鋼」，但品質不夠就是玩假的，給上級看。

什麼叫做玩真的？就是AI模型的規模、品質要好，要能比人家快跨進新領域。例如醫療AI模型，很快就能開發新藥，對付新的疾病。

好的服務最後都要面臨商業化，獲利當然也是一個指標，但更基本的問題是：服務有沒有價值？OpenAI做了這麼多年，搞不好還沒有獲利，但影響力很大。賺錢容易，價值影響力才難。（延伸閱讀｜吳恩達：生成式AI目前商業價值最小，未來三年將翻倍成長【完整全文】）

培養一萬名懂AI的技職生

做大型語言模型之前，要清整專業領域的資料，這很花功夫。一個領域需要幾千人個人做，可是做完以後就很值錢，你會擁有別人沒有的洞察。

清整資料，需要喜歡動手的人，例如以前台北工專、高雄工專那樣的技職人才。技職教育曾是台灣教育的基石，但我們卻自毀長城，把對動手有興趣的高中生推到科技大學，學一般大學課程，來到產業界又要重新訓練，無疑是浪費時間。

每一個行業都需要喜歡動手的人，動手的人，跟大學裡寫論文的研究人員，是兩種不同的人。學術研究，大約10%的人做就夠了，我們還需要成千上萬個工程師，把AI做到可以用的程度。

台灣要多少能動手的AI技職人才？我的目標先設定一萬人，但需求應該遠超過這個數字。

AI需要很多動手的人來整理資料。舉例來說，過去學生原本是學機械、學化工，但是現在為了將機械、化工產業推到下一個階段，學生也要學習整理資料、做模型。所以，學AI其實是技職教育的延伸，把本來就要動手做的課程，延伸到產出資料、產出AI模型，應用在產業界。

又比如，每個醫院都在做自己的AI模型，有的醫院每個科都提AI計畫，跟我合作的一家醫院，甚至有200個AI計畫。這些資料誰來整理？現在都是醫師自己來，但醫師人力這麼貴，應該讓技職學生去標。

我來北科大，就是因為他們最接近這個做法。北科大開始慢慢動起來，回過頭來做以前技職該做的事。

對台灣來說，AI產業的出現，是彌補技職教育的契機。做AI需要清理、維護、管理資料，這些都要動手做，學完之後，找工作也快。（延伸閱讀｜AI人才能力檢定2024年上路，半導體、資通、醫療、金融、政府、製造、資安七產業先行）

技職教育-AI人才-孔祥重-新北市教育局-技職生-AI模型-數位人才-AI發展-人工智慧-人才-資料-政策-科技發展-台灣孔祥重認為，技職生強調「動手做」，能成為AI產業裡清整、管理資料的重要人才。圖片來源：新北市教育局

教台灣人說英文，不如教外國人說中文

美國這麼大的國家，高科技業75%都是外國人，而目前台灣的AI人才，更是質與量都不夠。關於人才，還有一件很簡單、但我們沒做的事。

台灣為了國際化，全民學英文，但遠水救不了近火。我們生活環境是全中文，如果公司強迫開會講英文，因為詞不達意，五分鐘後可能所有人又變回中文。這樣的工作環境，外國人無法長期待在台灣。

以前台灣花了好多錢，把外國學生找來頂尖大學，但是這些人不會講中文，就留不下來，因為以後工作不會有前途。你想，要在台積電、聯發科升遷，可以不講中文嗎？

但台灣科技業是有吸引力的，台灣也需要這些人才——所以，與其教台灣人講英文，不如教外國人講中文，或規定要會講一定程度中文，才給工作證，教他專業技能，他才會久留台灣。

教外國人說中文，比教台灣人說英文容易多了。

台灣現在有幾萬個國外專業人才，給他們四個月密集中文課程，現在有ChatGPT，學起來更快。

讓幾萬個能動手的人才進台灣，再從一年幾十萬高中畢業生中挑十分之一去技職。我所有的建議裡，這一個最有用。（延伸閱讀｜「IMD數位競爭力」下滑三名，透露台灣科技人才與高教政策哪些缺口？）

產業策略卻長期規劃，短期就是做虛工

發展產業，政府要懂策略方法。先做好簡單的基本功，不要找藉口，一直去做那些很麻煩的事，把事情變複雜，也難掌握精髓。

政府可以做短期計畫，但長期計畫更要有；沒有長期計畫，短期就是做虛工。只要短期計畫後面有目標一致的長期計畫，五、六年下來，台灣就會慢慢變好。

40年前台灣做半導體發展計畫時，準備了五、六年，做計畫的、提建議的，不是坐在辦公室做簡報的一般幕僚，而是熟悉產業的高手專家，熟悉產業的人，才能制定真正對台灣有用的策略。做那種計畫，三個月做不出來，至少要三年。台灣需要找到這種產業專家幫忙，他們大多在國外。

政府計畫必須重新做得更嚴謹、更完整、更有遠見，比如技職教育。這是我們重新檢視教育政策的機會，AI是一面很好的鏡子，以前做錯的事，現在就要從根本解決問題。不要期待有天縱英明的人出來領導，發展AI產業就是一步一步走，方向定了，努力做事。

若能做到，台灣就能成為真正的「AI之島」。

孔祥重給台灣的AI建議行動

一、技術和應用：加速AI技術和應用

將台灣獨特數據轉換為AI模型
開發AI驅動的工具，以支持半導體和醫療影像等戰略應用
擴展國家雲以支持AI計算

二、對齊：將AI與安全性和可信賴性對齊

根據人類回饋微調通用AI模型，以獲得有幫助和無害的AI
推廣開源模型以允許監控和促進專業化
制定和發布AI行為準則

三、基礎模型：開發在台灣本地數據和其他數據上預訓練的基礎AI模型

通用基礎模型：使用台灣本地內容支持台灣的通用任務
領域特定基礎模型：使用來自特定領域的數據來支持特定領域的任務

四、數據：策劃開放原始資料以進行AI建模

制定政策、開放原始碼授權許、數據管道和應用程序對口（API），以便研發團隊和私部門公平、安全、輕鬆地使用政府擁有的資料
提供激勵措施，讓私人資料開放以供更廣泛使用

五、實踐：培育資料準備和模型開發的實踐AI人才

在大學建立（重新建立）優質職業教育
每年至少招收一萬名高中畢業生，他們有心去實踐、現實世界的專案

六、國際：整合國際AI專業人士

教授外國專業人士說中文，促進他們融入產業和學術界（由ChatGPT輔助的四個月沉浸式語言課程可能就足夠了）
將工作許可與中文語言技能掛鉤

如何掌握AI趨勢？你可以閱讀以下文章：

未來城市編輯部

《未來城市》是《天下》於2018年推出的智慧科技與設計交流平台。透過報導智慧城市、社會設計、專家洞察，期望成為一個提供市民、企業和政府單位對話的平台。

其他人也在看

科技趨勢

AI是新護國神山嗎？從「台灣人工智慧年會」5週年看產業AI化的發展與挑戰

科技趨勢

生成式AI七大產業趨勢　簡立峰：大型語言模型很棒，但仍欠缺商業模式

科技趨勢

如何站上AI巨人肩膀？台灣的六個應變策略

台灣要成「AI之島」？人工智慧學校校長孔祥重：先清政府資料、建產業模型、養技職人才

清整、開放、維護國家資料

各行各業都要建立基礎AI模型

培養一萬名懂AI的技職生

教台灣人說英文，不如教外國人說中文

產業策略卻長期規劃，短期就是做虛工

孔祥重給台灣的AI建議行動

如何掌握AI趨勢？你可以閱讀以下文章：

其他人也在看

你可能有興趣

影音推薦

您的帳號尚未驗證

已發送驗證信