本文重點
A: 陳縕儂是台大資工系副教授,專攻 AI 語音辨識與對話互動。她在 AI 尚未主流時便投入語音辨識研究,博士期間更鑽研多輪對話技術。2016 年以 29 歲之齡回台大任教,是當時資工系最年輕的教授。近年主導開發 Taiwan LLM 與 Project TAME,致力打造適合台灣產業需求的本地化語言模型。
A: Taiwan LLM 是陳縕儂研究團隊於 2023 年底發布、以 Meta Llama 2 為基礎訓練的繁體中文語言模型。2024 年七月推出的進階版 Project TAME,整合半導體、化工、醫療、法律等產業資料,基於 Llama 3 進行 5,000 億字預訓練,目標是在特定專業領域超越通用模型表現。
A: 陳縕儂指出,台大資工系男女比約6:1,AI 實驗室有時完全沒有女生。她認為科技產品與日常生活密切相關,若開發者清一色是男性,難以真正理解女性需求。她的核心觀點是:某個領域女性愈少,女性愈該投身其中,否則產品只會愈來愈偏離女性視角。
在這些光鮮亮麗的標籤下,卻藏著一個始終如一的叛逆者。大學就立志當老師的陳縕儂,意外把自己的存在活成一堂生動的公開課:透過自身形象,讓大眾看見AI的魅力,以及女性在尖端科技的傑出表現。
進冷門領域,只想做有趣的事
陳縕儂自認叛逆,傳統教育「要跟大家一樣」的教條約束不了她,「我需要有很多明確的理由,來告訴我為什麼要這樣做。」特立獨行的性格,也體現在她的職涯:先選了男性為主的資工系,再進了冷門研究領域:AI語音辨識。
「有個學長問我:『你怎麼會想加入這個實驗室?我們已經走到黃昏了!』」陳縕儂回憶,當時,語音辨識技術已多年沒有重大突破,準確度僅徘徊在七到八成之間,「產業界上完全沒有需求。」
學長的弦外之音是,研究冷門領域,畢業後找不到相關工作。但陳縕儂毫不動搖,「那又如何?我就是只想做一個我覺得有趣的東西啊!」從小,她就覺得睡覺前要爬起來關燈是件麻煩事;若能像電影情節,出一張嘴就能讓電腦完成所有任務,「這不就是我想要的未來嗎?」
即便到了出國讀博士,陳縕儂依舊不改初衷,還一頭栽入更難、更冷門的語音對話互動。
「如果連語音辨識都辨識不好,就更別說多輪對話了,」陳縕儂解釋,在ChatGPT問世前,聊天機器人都沒辦法多次來回互動;即使Siri能完成一次性語音指令,但也無法連續多次對話幾輪。因此,她的主要研究圍繞著AI語音客服,嘗試讓機器擁有對話能力,並提升到能商用等級。
然而,堅持理想的代價也隨之而來。「美國是非常資本主義的環境,市場沒有需求,就申請不到研究經費,當時我的老師超窮的,」她苦笑道,當時不但實驗室只有兩個員額,她的薪水還一度斷炊。
第一志願:回台灣當老師
儘管如此,陳縕儂叛逆不減。許多人在美國求學後會留下求職,她卻提早畢業,以提高錄取台大教職的機率,把微軟的正職邀約當備案。「從出國到畢業,我都沒有改變這個first priority(第一優先,此處指回台灣當老師),」陳縕儂堅定地說。
她心中的典範是指導教授、電機系名譽教授李琳山。回首當年,陳縕儂學到最多的不是知識,而是環境。
「一個好的環境,能讓學生看到更多機會與可能,」她在李琳山實驗室與優秀學長姐討論、合作,閱讀實驗室歷屆畢業生的論文;有次在國外開會,見到傑出學長姐們與李琳山談笑風生,更令她眼界大開:「我深刻體會到,一個好老師的影響力可以如此深遠。」
這些經歷都形塑了陳縕儂對自己未來的期望。「我希望能為學生創造這樣的環境,不是直接告訴他們『這裡有這麼多選擇』,而讓他們自己去接觸、思考,發現『原來可以做這個』!」即便最後無法像學長姐一樣傑出,「但能透過教育為優秀學生貢獻一份力量,看到他們最後成功,也感到與有榮焉。」
陳縕儂鼓勵學生探索,也從中找到熱愛的事物。圖片來源:賴永祥攝
這種鼓勵學生自我探索的教育理念,在陳縕儂的職涯中意義特殊——作為少數在理工領域嶄露頭角的女性,她深知多元的重要:台大資工系男女比約六比一,在AI實驗室中性別比例更加懸殊,有時甚至完全沒有女生。
近年到幾間高中演講,陳縕儂才漸漸發現,許多女生其實相當在意旁人想法,可能順應社會期待選擇文法商科系。
面對這種情況,陳縕儂總是鼓勵女學生要多方探索,找到真正熱愛、長期投入不會痛苦的事;但她也深知,許多女生受刻板印象所苦,認為「理工科佼佼者都是男性,女生沒什麼前景。」 面對這種疑惑,她總是耐心解釋,「科技應用與人類日常生活息息相關,如果開發者全都是男性,他們能真正理解並滿足女性用戶的需求嗎?」
她尤其鼓勵女性加入AI領域,「當某個領域女性愈少,你更應該投身其中,」她語重心長,「否則,這個領域只會愈來愈缺乏女性視角,產品也會愈來愈遠離女性需求。最終可能演變成只有男性在開發和使用,造成更大的不平衡。」
持續改良語言模型,實現本地化
追求多元的她,自然也想抵抗國外大廠以英語為主的語言模型。
「YouTube早就推出自動生成英文字幕的功能,但到現在還不支援中文,代表他們不覺得這是重要或優先市場,」陳縕儂認為,與其被動期待國際大廠模型支援中文,台灣更該掌握主動權,自行打造大型語言模型。
於是2023年底,陳縕儂研究團隊發布以Meta Llama 2為基礎訓練的Taiwan LLM,隨即吸引許多企業接觸了解;今年七月發表的進階版Project TAME,便是藉由合作企業提供半導體、化工、醫療與法律等各專業資料,基於Llama 3進行5,000億字預訓練而成。
「有些企業有算力沒資料、有些沒算力有資料,我們就橋接資源,把模型開源出來,」陳縕儂解釋,Project TAME訓練資料來自各產業,預期將在特定產業領域上能有更好的表現,甚至期待Project TAME能通過台灣律師考試。
展望未來,陳縕儂研究團隊正嘗試教AI讀懂人們的「言外之意」。
「例如我說『今天好累喔』『桌上碗盤還沒收』,言外之意就是『你有空可以去收』,」她解釋,這項研究持續探索AI的極限,也更凸顯本地化的重要,因為在不同文化中,同一情境的共識可能不同。
選擇一條更具挑戰性、更能體現本土特色的研究道路,也是作為AI學者的叛逆。
小檔案|陳縕儂
台大資工系副教授陳縕儂。圖片來源:賴永祥攝
- 出生:1987 年
- 現職:台大資工系副教授
- 學歷:台大資訊工程所碩士、美國卡內基美隆大學語言科技所博士
- 榮譽:科技部年輕學者獎、台灣傑出女科學家新秀獎
延伸閱讀
- 發起本土語言模型TAIDE 台灣AI教育先驅許永真:給本土AI人才一個練兵場
- 「想活到被肯定那一天!」屠夫之女、流浪30年科學家,熬成mRNA疫苗之母
- 「AI實現醫學牛頓時刻」旅美AI科學家林清詠陽明交大畢業致詞:開闊視野、追求精準、連結創新
深度專題|台灣AI 20
「AI即國力」在2024年已成共識。進入新時代,天下「未來城市」推出了「台灣AI 20」專題報導,邀請產官學代表組成推薦委員會,選出20位在AI的技術創新、產業應用、政策推動、知識教育和社群連結五大領域中,選出20位對台灣AI發展有重大影響的人物。
誰是台灣AI 20人物?他們為台灣做了哪些事?立刻點擊閱讀「台灣AI 20」深度專題。





