台灣要成「AI之島」?人工智慧學校校長孔祥重:先清政府資料、建產業模型、養技職人才

台灣要成「AI之島」?人工智慧學校校長孔祥重:先清政府資料、建產業模型、養技職人才
孔祥重認為,台灣先關注資料與人才兩大議題,才有機會成為「AI之島」。圖片來源:賴永祥攝
2024-03-18
採訪、撰文・陳芳毓
7296
採訪結束後,台灣人工智慧學校校長孔祥重坐在台北科技大學辦公室拍照。他看著身上外套的logo,彷彿想起什麼,「宏遠興業,是我跟昇瑋最早拜訪的幾家廠商。」

2017年,孔祥重帶著對台灣未來產業的憂慮,從哈佛大學學術休假返台。中研院院長廖俊智將這位地位崇高的資工學者,介紹給陳昇瑋——一位與他有著相同憂慮的年輕數據科學家。當時,陳昇瑋已連續舉辦四屆資料科學年會,最多曾吸引1,800人參加,是台灣最大的資料愛好者社群。

一位大學畢業即赴美深造的72歲學者,一位41歲的本土資訊工程新星,一拍即合。

孔祥重回憶,當時兩人每週都往中南部的工廠鑽,一家家拜訪、一遍遍介紹;在人們對AI半信半疑的年代,扛起台灣產業AI化的重擔。隔年,兩人在中研院支持下成立「人工智慧學校」,以每年上千人的速度,為台灣累積AI人才。

2023年,孔祥重再度趁學術休假回到台灣。七年過去,AI已從實驗室走進辦公室,生成式AI也正風起雲湧;儘管昔日戰友陳昇瑋已溘然長逝,但要做的事還更多,孔祥重仍舊馬不停蹄地奔波於企業、校園和政府之間。

「70年代個人電腦、90年代網路,都比AI革命小太多了!」這位78歲的學者興奮地滔滔不絕。他認為,AI將顛覆的不止是科技,而是各行各業,包含人文社會領域。「現在變化這麼快,資深的人有經驗,能幫的忙更大,退休就虧大了!」

焦點回到台灣。70年代個人電腦革命,帶起施振榮等台灣科技業第一批創業家,90年代網路革命,台灣也沒有缺席。這一次AI革命,台灣能扮演什麼角色?

去年12月的科技部「科技顧問會議」上,孔祥重當著國科會主委吳政忠、聯發科董事長蔡明介等左右台灣未來關鍵人物的面,提出六個國家戰略、共14個行動項目。「這是給政府的意見。行動,就是必須做的事。」

其中,資料與人才更是關鍵。

科技顧問會議-國科會-吳政忠-蔡明介-聯發科-蔡英文-陳建仁-行政院-人工智慧-人才-資料-政策-科技發展-台灣孔祥重(前排左三)出席2023年科技顧問會議,提供國家科技發展意見。圖片來源:行政院

以下為孔祥重的專訪重點:

我提出六個國家戰略的行動建議,其中兩個最重要,一個是資料,一個人才

清整、開放、維護國家資料

資料是誰的責任?政府擁有的資料最多,所以政府要負很大責任。

理論上,政府每一項計畫、研究,都會產出資料,這些數據應該整理好,並且開放,讓台灣本土AI模型做訓練。但是,現在的政府資料出了什麼問題?

第一:原始資料(meta data)不明,是什麼樣的資料?何時搜集?是否經過整理?錯誤的資料是否清整?都不清楚。

第二:不知道資料放在哪,伺服器經常換。許多實驗產出數據,寫兩篇論文後,資料就不知放到哪去。

第三:授權規格不明。有沒有使用同意書?資料使否定期更新維護?

所以,儘管政府都說有資料,但只要資訊沒有整理到AI模型能用的程度,都不算真的資料。以這個標準來看,可用的政府資料其實很少。沒有資料,就做不出AI模型。

資料沒有清理、規範、定義、維護,也沒有編相關預算,就只能做表面的事;比如看到世界都在做大型語言模型,我們也要有反應,但做反應太容易了,真正困難的,是擁有本土資料。

有人說算力不夠,但這並非眼前的問題。如果有資料,算力可能不夠,但眼前的問題是連資料都還沒有。

清整資料後,政府資料應該開放給私人企業或研發人員使用。有資料可玩,人才才會有發展;沒有本土資料,怎麼做AI模型都難脫中國的影響。

部分私人資料若能開放,也私人機構也有好處。比如Google也放出許多資料,社群會用這些資料做出一些新東西,Google也會學到新作法。(延伸閱讀|數位時代,台灣如何靠資料治理實踐海洋國家冒險精神?

AI應用-數位發展-孔祥重-台灣AI-AI發展-人工智慧-生成式AI-國家資料-人工智慧-人才-資料-政策-科技發展-台灣孔祥重指出,台灣缺乏本土資料,AI發展難以邁開步伐。圖片來源:賴永祥攝

各行各業都要建立基礎AI模型

擁有台灣本土資料,就能做AI模型。通用資料可以做通用模型,給一般人用;專業領域資料,如製造業、醫療業,就做專業模型,給產業用,尤其是台灣最有優勢的半導體業。

我正與一家半導體公司合作,研究如何用生成式AI設計晶片,這能大幅縮短研發時間,快速推出新產品。例如,以前一個新想法,可能因為太貴、太耗人力,無法實踐,得拖上一、兩年。但生成式AI模型能疊加各種功能,把研發過程變得更快更容易。

理論上,每個領域都要做出自己的基礎模型,各企業就能在這個基礎上,用自己的資料做微調(fine-tune)。但做不出基礎模型,就只是土法煉鋼;雖然看起來很成功,但有經濟效益嗎?品質夠好嗎?未來能快速進步嗎?下一步就是真正的挑戰。

做出亮點AI專案不難,花錢、花時間就行。剛開始可以這樣起步,以後不行,這沒有規模,也做不好。就像文革時代,中國鋼的產量不夠,所以每個人民公社都在「煉鋼」,但品質不夠就是玩假的,給上級看。

什麼叫做玩真的?就是AI模型的規模、品質要好,要能比人家快跨進新領域。例如醫療AI模型,很快就能開發新藥,對付新的疾病。

好的服務最後都要面臨商業化,獲利當然也是一個指標,但更基本的問題是:服務有沒有價值?OpenAI做了這麼多年,搞不好還沒有獲利,但影響力很大。賺錢容易,價值影響力才難。(延伸閱讀|吳恩達:生成式AI目前商業價值最小,未來三年將翻倍成長【完整全文】

培養一萬名懂AI的技職生

做大型語言模型之前,要清整專業領域的資料,這很花功夫。一個領域需要幾千人個人做,可是做完以後就很值錢,你會擁有別人沒有的洞察。

清整資料,需要喜歡動手的人,例如以前台北工專、高雄工專那樣的技職人才。技職教育曾是台灣教育的基石,但我們卻自毀長城,把對動手有興趣的高中生推到科技大學,學一般大學課程,來到產業界又要重新訓練,無疑是浪費時間。

每一個行業都需要喜歡動手的人,動手的人,跟大學裡寫論文的研究人員,是兩種不同的人。學術研究,大約10%的人做就夠了,我們還需要成千上萬個工程師,把AI做到可以用的程度。

台灣要多少能動手的AI技職人才?我的目標先設定一萬人,但需求應該遠超過這個數字。

AI需要很多動手的人來整理資料。舉例來說,過去學生原本是學機械、學化工,但是現在為了將機械、化工產業推到下一個階段,學生也要學習整理資料、做模型。所以,學AI其實是技職教育的延伸,把本來就要動手做的課程,延伸到產出資料、產出AI模型,應用在產業界。

又比如,每個醫院都在做自己的AI模型,有的醫院每個科都提AI計畫,跟我合作的一家醫院,甚至有200個AI計畫。這些資料誰來整理?現在都是醫師自己來,但醫師人力這麼貴,應該讓技職學生去標。

我來北科大,就是因為他們最接近這個做法。北科大開始慢慢動起來,回過頭來做以前技職該做的事。

對台灣來說,AI產業的出現,是彌補技職教育的契機。做AI需要清理、維護、管理資料,這些都要動手做,學完之後,找工作也快。(延伸閱讀|AI人才能力檢定2024年上路,半導體、資通、醫療、金融、政府、製造、資安七產業先行

技職教育-AI人才-孔祥重-新北市教育局-技職生-AI模型-數位人才-AI發展-人工智慧-人才-資料-政策-科技發展-台灣孔祥重認為,技職生強調「動手做」,能成為AI產業裡清整、管理資料的重要人才。圖片來源:新北市教育局

教台灣人說英文,不如教外國人說中文

美國這麼大的國家,高科技業75%都是外國人,而目前台灣的AI人才,更是質與量都不夠。關於人才,還有一件很簡單、但我們沒做的事。

台灣為了國際化,全民學英文,但遠水救不了近火。我們生活環境是全中文,如果公司強迫開會講英文,因為詞不達意,五分鐘後可能所有人又變回中文。這樣的工作環境,外國人無法長期待在台灣。

以前台灣花了好多錢,把外國學生找來頂尖大學,但是這些人不會講中文,就留不下來,因為以後工作不會有前途。你想,要在台積電、聯發科升遷,可以不講中文嗎?

但台灣科技業是有吸引力的,台灣也需要這些人才——所以,與其教台灣人講英文,不如教外國人講中文,或規定要會講一定程度中文,才給工作證,教他專業技能,他才會久留台灣。

教外國人說中文,比教台灣人說英文容易多了。

台灣現在有幾萬個國外專業人才,給他們四個月密集中文課程,現在有ChatGPT,學起來更快。

讓幾萬個能動手的人才進台灣,再從一年幾十萬高中畢業生中挑十分之一去技職。我所有的建議裡,這一個最有用。(延伸閱讀|「IMD數位競爭力」下滑三名,透露台灣科技人才與高教政策哪些缺口?

產業策略卻長期規劃,短期就是做虛工

發展產業,政府要懂策略方法。先做好簡單的基本功,不要找藉口,一直去做那些很麻煩的事,把事情變複雜,也難掌握精髓。

政府可以做短期計畫,但長期計畫更要有;沒有長期計畫,短期就是做虛工。只要短期計畫後面有目標一致的長期計畫,五、六年下來,台灣就會慢慢變好。

40年前台灣做半導體發展計畫時,準備了五、六年,做計畫的、提建議的,不是坐在辦公室做簡報的一般幕僚,而是熟悉產業的高手專家,熟悉產業的人,才能制定真正對台灣有用的策略。做那種計畫,三個月做不出來,至少要三年。台灣需要找到這種產業專家幫忙,他們大多在國外。

政府計畫必須重新做得更嚴謹、更完整、更有遠見,比如技職教育。這是我們重新檢視教育政策的機會,AI是一面很好的鏡子,以前做錯的事,現在就要從根本解決問題。不要期待有天縱英明的人出來領導,發展AI產業就是一步一步走,方向定了,努力做事。

若能做到,台灣就能成為真正的「AI之島」。

孔祥重給台灣的AI建議行動

一、技術和應用:加速AI技術和應用

  • 將台灣獨特數據轉換為AI模型
  • 開發AI驅動的工具,以支持半導體和醫療影像等戰略應用
  • 擴展國家雲以支持AI計算

二、對齊:將AI與安全性和可信賴性對齊

  • 根據人類回饋微調通用AI模型,以獲得有幫助和無害的AI
  • 推廣開源模型以允許監控和促進專業化
  • 制定和發布AI行為準則

三、基礎模型:開發在台灣本地數據和其他數據上預訓練的基礎AI模型

  • 通用基礎模型:使用台灣本地內容支持台灣的通用任務
  • 領域特定基礎模型:使用來自特定領域的數據來支持特定領域的任務

四、數據:策劃開放原始資料以進行AI建模

  • 制定政策、開放原始碼授權許、數據管道和應用程序對口(API),以便研發團隊和私部門公平、安全、輕鬆地使用政府擁有的資料
  • 提供激勵措施,讓私人資料開放以供更廣泛使用

五、實踐:培育資料準備和模型開發的實踐AI人才

  • 在大學建立(重新建立)優質職業教育
  • 每年至少招收一萬名高中畢業生,他們有心去實踐、現實世界的專案

六、國際:整合國際AI專業人士

  • 教授外國專業人士說中文,促進他們融入產業和學術界(由ChatGPT輔助的四個月沉浸式語言課程可能就足夠了)
  • 將工作許可與中文語言技能掛鉤

如何掌握AI趨勢?你可以閱讀以下文章:

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結