中央大學資工系教授蔡宗翰觀察,訓練AI資料時,文組人更擅長確認資料的是否偏誤、有無適切,能扮演AI時代的關鍵角色。所以,他在台大開設「數位人文技術與應用專題」,打破「文組人不懂AI」的刻板印象,教文、理組學生開發文史專用AI,證明跨域合作的價值。
不只開設大學課程,蔡宗翰也將AI專業投入百工百業,與老師開發華語教學AI、作文批改AI。他發覺,擁有實戰經驗的人更適合投入AI訓練,能精準地微調AI能力,加速完成工作。
在AI應用上,蔡宗翰還有哪些思考?本集未來城市邀請蔡宗翰分享他的AI經驗及觀察。
未來城市Podcast EP.99
▹ 未來主持人:未來城市頻道資深總監陳芳毓
▹ 未來大來賓:中央大學資工系教授蔡宗翰
▹ 訪談精華一次收藏:
問:在AI時代,大家都覺得語言模型很會說話、很會寫字,您認為文組人該如何定位角色、做哪些事呢?
蔡宗翰(以下簡稱蔡):AI的發展過程中,需要兼顧多樣性與各種平衡的資料——這如同人類讀書與進修,是需要教材與老師的。
事實上,我認為術業有專攻。文組人擅長讓AI講出道地、精準的語言;能判斷是否根據用戶需求,提供正確資訊,且確認內容有無偏誤;也能了解資料是否兼顧多樣性,並確認這些資料對社會帶來的影響。這是文組生更有敏感度,也更擅長的部分。
問:您曾描述學習AI就像去西天取經的團隊,而文組人是唐三藏,理組人則能組成駱駝商隊,把人帶到目的地。您去年在台大文學院開了一堂「數位人文技術與應用專題」,就是希望實踐這個理想嗎?
蔡:人類是多樣性的。我在國科會的TAIDE大語言模型計畫裡面,深刻體認到在資料蒐集、設計任務、評估、指令等方面都需要文組人才的加入,才能夠讓這些設計出來的AI更有人味,更能理解人的想法。
社會對文組的刻板印象就是不會數學、不會程式,只要碰到機器就先退避三舍。但是,這個狀況已經改變了。例如,Python語言已讓寫程式的門檻變得更低,且大部分工作都被包裝成API(Application Interface)——只要知道如何寫指令、叫出函式、呼叫大語言模型,就可以做到他想要做的事情,也才會意識到有哪些問題需要克服。
蔡宗翰指出,人文專業是AI應用的關鍵橋樑。圖片來源:陳俊銘攝
「數位人文技術與應用專題」的目標,是要開發一個文史專用的大語言模型,並由十幾位修課同學分成兩組、完成專案。同學必須提供AI學習的教材資料、AI表現的評估資料,並完成許多指令與回應的範例;整體而言,寫程式的份量不少,各組成員還要擔任不同角色。其中,有位外文系學生對AI很感興趣,也自學Python;他在小組內自告奮勇擔任專案經理、監督組員進度,協助專案穩定進行,展現了他的領導力。
這門課的學生組成很多元,都是對AI有興趣的人,不同領域間也有共通點。例如,資工所與歷史所學生都會基於事實說話,且很有邏輯,所以他們討論時較沒問題;歷史所同學也能精準地把需求傳達給資工系同學,並請對方提供協助。
問:除了大學生,您有沒有考慮為剛畢業一、兩年的社會年輕人,或中高齡工作者開設課程,讓他們重新學習AI,並發揮在工作領域上?
蔡:我滿想做這件事,因為訓練AI更適合有實作經驗的人。以出版業為例,資深編輯最清楚編輯最需要完成哪些任務、最有能力判斷AI的文字水準;一但訓練好AI的能力,就能放入你的想法,讓AI按照邏輯、寫出文字。
我認為,這就是模型是否經過微調(fine-tuning)的差別,我們需要不同專業的人,一起搜集百工百業的資料,才能完成訓練。
問:我記得您的想法有實際應用在工作場域上,比如說,教育部的華語教學專案就有相關應用,對嗎?
蔡:對,我們在去年五月前就完成了TAIDE模型,接下來我們把目標轉移到百工百業落地。但這個模型並不是ChatGPT這類的通用大模型,TAIDE是小模型,只是提供一個胚胎,讓你微調成一個專用模型。
後來,我與教育部的華語老師合作。我們根據老師指定的課程等級、主題形式,生成一篇華文課文、單詞表或語法表;甚至可以貼一篇新聞,讓AI轉成一篇可以進行教學的課文。等國科會開發後,今年就會移轉給教育部繼續營運。
另外,去年下半年我們也做了一支作文批改AI。先由大考中心老師提供約一、兩千筆作文批改資料,我們再進行擴增、訓練AI模型並批改分數。AI的打分標準比照學測,目前誤差在兩分左右;如果是AI沒看過的題目,誤差會在3.8分。
AI的分數誤差是很低的,因為,在實際學測的作文評分要落差到七分,才會找第三位老師確認是否有評分偏差。我們希望,這項AI模型可以幫助同學練習作文。
聽懂未來:關於AI教育,我還想知道更多⋯
未來城市給你更多知識補充包!
想聽更多未來城市Podcast節目?
- 首播時間:隔週六播出。
- 頻道搜尋:天下雜誌Podcast頻道「聽天下」,或關注未來城市網站「未來城市Podcast」系列內容。





