開發人人必用AI工具,還送「售後服務」 林智仁:影響力就是世界因你而不同

開發人人必用AI工具,還送「售後服務」 林智仁:影響力就是世界因你而不同
林智仁開發了資料分類軟體LIBSVM——這曾是機器學習的必用軟體,下載次數多達115萬次。圖片來源:廖祐瑲攝
2024-10-02
採訪、撰文・陳芳毓、王茜穎
9240
台大資工系特聘教授林智仁,是台灣機器學習軟體的先驅與權威。

本文重點

  1. 林智仁開發的LIBSVM軟體在2000到2015年間,已廣泛應用於機器學習領域,下載超過115萬次,相關論文引用超過五萬次,為台灣AI研究最高引用論文。
  2. 林智仁面臨研究方向選擇、人才短缺和產生影響力三大挑戰。他堅持長期投入、提供優質「售後服務」,使LIBSVM成為廣受歡迎的開源工具。
  3. 深度學習興起改變了機器學習環境,林智仁轉而關注協助企業正確使用AI工具。他認為最大成就是幫助了使用者,並持續努力解決新挑戰。

2000年投入機器學習,他與研究團隊開發出的資料分類軟體LIBSVM,迄今下載超過115萬次,一篇期刊論文《LIBSVM-A Library for Support Vector Machines》引用超過五萬次,是台灣AI相關研究中,引用次數最高的論文。

可以說,在2000年至2015年的十多年間,全球舉凡是做機器學習的人,每個人都會用LIBSVM

資料分類(data classification)是AI應用的基礎。先蒐集數據,接著上標籤,再將之作為訓練教材,教機器根據既有標籤建立分類模型,以做將來預測,如新聞網站分辨新聞類別、電商做商品分類。LIBSVM的核心能耐,是運用數學,減少建模所需時間,而且介面友善,不熟悉機器學習技術的人也容易操作。

可以說,他用一個開源工具,撐起了一個時代的AI創新,成為幕後推手中的巨人。

因為在機器學習演算法和軟體設計上的重大貢獻,2011年,在林智仁40歲生日前夕,獲選了「國際電機電子工程師學會」新科會士(IEEE Fellow),每年僅千分之一的會員有此殊榮。

2014年,他再度獲選人工智慧領域最具影響力的專業組織「國際人工智慧促進協會」會士(AAAI Fellow)。那一年全球僅九人入選,他是唯一的亞洲人,也是迄今唯一上榜的台灣人。

隔年,他又獲選國際計算機協會會士(ACM Fellow),因為「對機器學習和資料探勘的理論和實踐的貢獻」。

儘管成就極高,在接受《未來城市》專訪時,他最常說的詞卻是「難」,「非常難」。

研究的三個「難」

第一難,發生在他從美國密西根大學拿到工業工程博士,剛回到台大任教。

「為什麼會去做這個?我的博士班做的東西不是機器學習⋯⋯」他細說從頭,自己做的是應用數學,但到了資工系,學生對數學興趣不大,可是能力強,程式寫得好。

他苦思後,找到了剛起步的機器學習領域,跟他的博論研究主題「數值優化」(numerical optimization)相關,且一腳跨數學,一腳跨程式,能結合兩邊優點,從跨領域中找突破。

「一開始其實根本沒有概念,會發展成後來的樣子。」他回憶,將選題當賭注,把成功謙虛地歸功於運氣,「就非常難啦。其實是非常難。」

第二難,是人才的挑戰。

「國外頂尖大學,博士生才是研究主力。我們這邊基本上是沒有的,」他返台任教26年來,只有三個博士畢業生(另有兩位在職博士畢業生)。

沒有人要念土博,大家都覺得拿到碩士,就能直接進產業。因為博班生極少,多數時候,是他帶著大學生、碩士生做;十多年來,靠一代代的學生做下去,他自己也跳下去做。

有學生曾在PTT上分享,「當看到老師比自己還拚,每天真的從醒來到睡覺都在做研究,我覺得至少我個人沒什麼辦法說我偷個懶啦。」

第三難,是如何產生影響力。

「我們的東西研究完了,通常是不會有人理你的⋯⋯研究成果有千百種,沒什麼理由突出到人家要來用你的,」更何況,LIBSVM不是第一個,也不是唯一的資料分類軟體。

「這件事是非常不容易的。」他嘆息。

但LIBSVM做到了。林智仁分析原因有二:一是長期投入,軟體更完整;二是學界少見的「售後服務」。

儘管開源,不收一毛錢,「user(使用者)如果有問題,我們一定都會處理。」

2010年到2015年,他經常每天都要處理使用者的詢問信;某次週日早上發布了新版本,結果有錯,一下午湧入了大量的抱怨信,當晚他就想辦法把它修好並發布。

為什麼?免費分享,還要投入大量時間處理用戶問題、更新版本,也不一定有論文可發,吃力不討好。

他當然也隱約感受到發表論文的壓力,明白要做比較長期的研究,中間的產量可能不會太好;「那一段時間,可能別人認為你好像沒有在做事,」他堅持,「我也想辦法要做別的,但既然有人用我們的東西,我們就要負責任⋯⋯不然我們做這個東西,不就失去它的意義嗎?這就是要給人家用啊。」

AI-人工智慧-AI 20-Taiwan AI 20-林智仁-機器學習-LIBSVM-台大-教授-研究-技術-科技林智仁長期投入LIBSVM,並提供售後服務,持續穩定軟體品質。圖片來源:廖祐瑲攝

話鋒一轉,他說也不是全無收穫。許多使用者回饋的功能建議,有時也給他指路,開發出重要的研究問題,發表的論文在當時也被高度引用,形成一個正向循環。

後來,使用者從個人變成了企業。他去了美國Yahoo和其他公司發現共同的問題,於是投入十年,開發出新軟體LIBINEAR,專門針對大規模文本的分類。

他發現,原先較為複雜的LIBSVM雖然強大,卻比較慢。只要文字夠多,根本沒必要拿出牛刀,因此又花了十年,開發出比較簡單但有效率的方法,可以快速處理非常大量的文本資料。

「那十年確實值得。那時候到現在都還是滿多人在用。」他說。

林智仁追求的是影響力,但什麼是影響力?是論文發表量?得獎?

他給出的答案是:「如果今天把這個學校從世界上移走,這個世界有什麼改變?如果沒有任何改變,表示它的存在沒有太大的價值。」

因此,他關心的是:要怎麼鼓勵大家做有影響力的工作?

「這件事情是非常困難的,非常困難,非常困難。」他一口氣說了三聲困難。

深度學習改變開發環境

LIBSVM叱吒風雲十多年,但2015年後,時代改變了。因為新的方法誕生了:深度學習。

這種更複雜的方法,能更好地解決過去的難題,如影像處理,驚豔了世界。方法變複雜了,開發環境也有了翻天覆地的變化。

過去小規模、較簡單的軟體,只須靠少數的人、足夠的努力,就能做出來。林智仁稱之為「小規模的手作」,「每一行我都知道在寫什麼。」

如今機器學習軟體極為龐大,需要大團隊才做得到,已經不是小團隊玩得起來的;軟體開發變成資本的遊戲,只有大公司才養得起大團隊,「它已經牽扯到公司的大小,甚至是國家的國力。」

​​這對林智仁的研究團隊產生巨大衝擊,無法複製過去的成功模式。儘管自嘲是「過氣的researcher(研究者)」,但他說:「我們也努力在做一些事情。」

帶著十個人的小團隊,他下一步最想解決的問題,依然是使用者的問題。

他觀察,多數台企對AI缺乏經驗,對機器學習了解不足,或工具不夠好。不管什麼數據或問題,不管必要與否,都用最高深的方法,信奉砸錢買算力。使用者無法判斷需不需要,或是哪種方法最適合。而且,做出來的結果好壞,使用者也不見得知道,因為他無法,甚至不知道要評估。

「他們需要一些幫助,」他說,「距離很遙遠,但總要開始做。做了再說吧。」

或許,這一投下去,又是另一個十年。但人生有幾個十年?採訪最終,記者問他最大的成就感來源是什麼?

他說:「我們有幫助了users(使用者)」。

小檔案|林智仁

AI-人工智慧-AI 20-Taiwan AI 20-林智仁-機器學習-LIBSVM-台大-教授-研究-技術-科技台大資工系特聘教授林智仁。圖片來源:廖祐瑲攝

  • 出生:1971年
  • 現職:台大資工系特聘教授
  • 學歷:台大數學系學士、密西根大學工業工程博士
  • 經歷:阿拉伯聯合大公國MBZUAI大學兼任教授
  • 榮譽:國際電機電子工程師學會會士(IEEE fellow)、國際人工智慧促進協會會士(AAAI fellow)、國際計算機協會會士(ACM fellow)

延伸閱讀

深度專題

「AI即國力」在2024年已成共識。進入新時代,天下「未來城市」推出了「台灣AI 20」專題報導,邀請產官學代表組成推薦委員會,選出20位在AI的技術創新、產業應用、政策推動、知識教育和社群連結五大領域中,選出20位對台灣AI發展有重大影響的人物。

誰是台灣AI 20人物?他們為台灣做了哪些事?立刻點擊閱讀「台灣AI 20」深度專題。

台灣AI 20|獨家名單!影響台灣AI發展的20人

其他人也在看

你可能有興趣

已成功複製連結