跨世代師徒拍檔，催生全球最快AI視覺辨識廖弘源：要用AI讓台灣被全世界看到

廖弘源帶領團隊發布YOLOv4模型，也引領台灣AI研究走向國際。圖片來源：賴永祥攝

2024-09-03

採訪、撰文・陳芳毓

9944

在全球AI物件偵測領域，從2020年後，就是台灣的天下。廖弘源、王建堯打造的YOLOv4到v9等版本證明，就算資金少，台灣也能靠創新領先世界。

本文重點

2020年，中研院資訊所長廖弘源團隊開發出YOLOv4模型，在AI電腦視覺及時物件偵測方面取得重大突破，論文引用數為當年全球第三名。
YOLOv4模型同時實現「快」「準」「省電」三要素，不僅夠精準，成本較低的人也能使用，也讓台灣佔據物件偵測領域的地位。
廖弘源強調解決關鍵問題的重要性，並致力於利用AI提升台灣的國際影響力。

2020年三月，新冠病毒風暴正席捲全球，台北南港的中研院實驗室裡，另一場可能改變世界的革命也正在悄然進行。

中研院資訊所所長廖弘源，和合作三年的得力助手、博士後研究員王建堯正盯著螢幕，屏息等待著。突然，螢幕上跳出一組數字，兩人相視一笑——他們知道，他們可能剛剛刷新了AI電腦視覺及時物件偵測的紀錄。

台灣小團隊刷新世界紀錄

師徒兩人剛完成了YOLOv4模型的最後測試。在AI的世界裡，「快」「準」「省電」三要素幾乎無法共存，但他們卻完成了這個不可能的任務：

用GTX1080Ti晶片來執行，YOLOv4每秒可即時偵測430幀影像，速度超過人類眼睛的十倍，但仍保有高精準度；它還能在普通的邊緣設備上運作，不須大型GPU或TPU支援，窮人也玩得起。

一個月後論文發表，學術界隨之轟動。在每年數十萬篇新發表AI論文中，YOLOv4的引用數迅速躋身2020年全球第三位，僅次於Google的Vision Transformer模型與OpenAI的ChatGPT3兩篇論文。

「他絕對是過去六、七年台灣AI學研界最重要的人之一，」人工智慧學校校務長蔡明順觀察。

來自台灣的小團隊，如何與有數十億美金資金支持的全球研究團隊並駕齊驅？

答案要追溯到2018年。當時，科技部長陳良基力推「業界出題，學界解題」的AI發展策略，廖弘源接下了一個看似平凡的任務：透過義隆電子裝在桃園的交通攝影鏡頭，解決塞車問題。

然而，這個任務隱藏著一個巨大挑戰——影像資料量大，雲端設備又昂貴，傳送儲存還有資安疑慮，所以得在邊緣設備端（如路邊攝影鏡頭）處理。但邊緣設備算力有限，如何進行複雜的AI運算？

用廚房來比喻，影像資料就像是大量食材，需要一個超大冰箱（雲端設備）來存放；但這樣既貴又慢，餐廳希望能將食材存在店內的小冰箱（邊緣設備）。然而，店裡的小冰箱（硬體）功能有限，只有大冰箱的5%容量。

面對這個難題，廖弘源跟團隊靈機一動：「我們要設計一個更好的演算法，降低成本，取代硬體運算的功能。」他不是去買更大的冰箱，而是想出一個聰明的料理方式（演算法）！

然而，哪個演算法的影像運算既快又好？王建堯尋尋覓覓，發現了YOLOv3。

與俄羅斯工程師攜手合作

YOLO的全名是「You Only Look Once」（你只要看一次），顧名思義，特色是用最少的運算資源，做最快的影像辨識。然而，這模型還是太大，裝不進邊緣設備的「小冰箱」。

「我們先動手做吧！」廖弘源找來幾位指導過的、已是教授的博士生，跟王建堯一起發展新的運算架構，最後推出了既能提高運算速度、又能維持精準度的CSP Net。

這個突破很快引起國際注意。當時DarkNet維護者、俄羅斯工程師博科夫斯基（Alexey Bochkovskiy）立刻邀請王建堯一起開發YOLOv4。一個跨越半個地球的AI軍團，悄然成形。

在新冠疫情蔓延的2020年初，當多數人們被迫居家，王建堯卻將自己關在實驗室，日以繼夜地測試模型速度；他的勤奮加上廖弘源的經驗，最終誕生了YOLOv4。

最少的資源，最快的影像辨識

YOLOv4的成功只是開始。為不使外界覺得只是僥倖，廖弘源團隊在四年內接連推出YOLOR、v7、v9版本，每一版都有核心理論及論文佐證，而且全數開源。現在，這些模型已被廣泛應用於各行各業，如交通管理、醫療診斷、農業監測，甚至國防領域等。

「2020年之後，物件偵測領域就是台灣的天下，」廖弘源自豪地說。

台灣AI 20-影像辨識-影像偵測-電腦視覺-演算法-人工智慧-科技-物件偵測-AI模型-精準-YOLO-中研院-廖弘源廖弘源與王建堯全力鑽研YOLO，且成功應用到國防、農業等領域。圖片來源：賴永祥攝

用AI讓台灣被全世界看到

「很少團隊像他這麼專注在同一個領域，」蔡明順解釋，許多研究者發一篇論文就換主題，廖弘源團隊卻不斷精進，「這代表YOLO不只是一篇論文，也是業界常用工具，使用者要求更精準、更低耗能。」

廖弘源和王建堯的成功並非偶然。儘管年齡相差近一倍，但能力和經驗恰好互補。沈默寡言的王建堯是本土博士，基礎功紮實；幽默風趣的廖弘源則是留美歸國，有30多年影像研究和實務經驗。「沒有他，我不可能做到；沒有我，他也不可能做到，」廖弘源這樣評價兩人組合。

更重要的，是廖弘源獨特的研究理念。一頭銀髮、人稱「老頑童」的他，選擇了一條少人走的路——當多數人追求論文發表量，他卻一心想解決重要問題。

他常提醒學生，「工程師用既存的方法，解決當下的問題；科學家用系統化的方法，解決長遠的問題。」

因為，只要能解決關鍵問題，即便短期無法產出論文，但遲早會迎來石破天驚的成果。而YOLO一役，不只應證了廖弘源的理念，更將他的團隊推上全球AI影像研究的巔峰。

廖弘源團隊完成此一大作後，挖角邀約不斷，但他不為所動；甚至還因擔心技術被壟斷，婉拒與大企業深度合作。這樣一位不在意物質回報的世界級學者，卻在今年欣然接下「晶創計畫」副執行長重任，扛下台灣下階段的AI國家級計畫。

「用AI讓台灣被全世界看到，是很好的方法！」在全球AI競賽中，廖弘源早已洞悉：勝利不在於資金多寡，而在於創新的力量。

「真正的強者，是強到國際都擋不住，那才叫強！」在他的願景中，台灣不僅要鞏固半導體霸主地位，更要插上AI的翅膀，翱翔於「軟硬整合」的新天地。

小檔案｜廖弘源

台灣AI 20-影像辨識-影像偵測-電腦視覺-演算法-人工智慧-科技-物件偵測-AI模型-精準-YOLO-中研院-廖弘源中研院資訊所所長廖弘源。圖片來源：賴永祥攝　圖片設計：未來城市

出生：1959年
現職：中研院資訊科學研究所所長
學歷：美國西北大學電機博士
經歷：中研院資訊所研究員、交大資工系、成大電機系合聘教授
榮譽：國際電機電子工程師學會會士（IEEE Fellow）、國科會傑出研究獎、教育部學術獎

深度專題｜台灣AI 20

「AI即國力」在2024年已成共識。進入新時代，天下「未來城市」推出了「台灣AI 20」專題報導，邀請產官學代表組成推薦委員會，選出20位在AI的技術創新、產業應用、政策推動、知識教育和社群連結五大領域中，選出20位對台灣AI發展有重大影響的人物。

誰是台灣AI 20人物？他們為台灣做了哪些事？立刻點擊閱讀「台灣AI 20」深度專題。

台灣AI 20｜獨家名單！影響台灣AI發展的20人點擊前往

「未來城市＠天下」編輯部

「未來城市＠天下」為《天下雜誌》旗下的數位媒體平台，關注城市在科技驅動、制度演變與人本需求交織下的持續轉型。平台以AI應用、智慧城市、交通安全與居住政策為核心議題，透過深度報導與國內外案例分析，提供理解城市發展趨勢的關鍵觀點，並成為城市治理與公共決策的重要參考。

其他人也在看

科技趨勢

台灣AI大神　如何推42歲微軟成功轉型？

科技趨勢

張忠謀讚「準備最齊全的CEO」　魏哲家領軍新台積，成全球AI發展關鍵引擎

科技趨勢

台灣科技如何再升級？盧超群：海外科學園區助攻，打通AI晶片任督二脈

跨世代師徒拍檔，催生全球最快AI視覺辨識廖弘源：要用AI讓台灣被全世界看到

本文重點

台灣小團隊刷新世界紀錄

與俄羅斯工程師攜手合作

最少的資源，最快的影像辨識

用AI讓台灣被全世界看到

小檔案｜廖弘源

延伸閱讀

深度專題｜台灣AI 20

其他人也在看

你可能有興趣

您的帳號尚未驗證

已發送驗證信

跨世代師徒拍檔，催生全球最快AI視覺辨識 廖弘源：要用AI讓台灣被全世界看到

本文重點

台灣小團隊刷新世界紀錄

與俄羅斯工程師攜手合作

最少的資源，最快的影像辨識

用AI讓台灣被全世界看到

小檔案｜廖弘源

延伸閱讀

深度專題｜台灣AI 20

其他人也在看

你可能有興趣

您的帳號尚未驗證

已發送驗證信

跨世代師徒拍檔，催生全球最快AI視覺辨識廖弘源：要用AI讓台灣被全世界看到