本文重點
- 2020年,中研院資訊所長廖弘源團隊開發出YOLOv4模型,在AI電腦視覺及時物件偵測方面取得重大突破,論文引用數為當年全球第三名。
- YOLOv4模型同時實現「快」「準」「省電」三要素,不僅夠精準,成本較低的人也能使用,也讓台灣佔據物件偵測領域的地位。
- 廖弘源強調解決關鍵問題的重要性,並致力於利用AI提升台灣的國際影響力。
2020年三月,新冠病毒風暴正席捲全球,台北南港的中研院實驗室裡,另一場可能改變世界的革命也正在悄然進行。
中研院資訊所所長廖弘源,和合作三年的得力助手、博士後研究員王建堯正盯著螢幕,屏息等待著。突然,螢幕上跳出一組數字,兩人相視一笑——他們知道,他們可能剛剛刷新了AI電腦視覺及時物件偵測的紀錄。
台灣小團隊刷新世界紀錄
師徒兩人剛完成了YOLOv4模型的最後測試。在AI的世界裡,「快」「準」「省電」三要素幾乎無法共存,但他們卻完成了這個不可能的任務:
用GTX1080Ti晶片來執行,YOLOv4每秒可即時偵測430幀影像,速度超過人類眼睛的十倍,但仍保有高精準度;它還能在普通的邊緣設備上運作,不須大型GPU或TPU支援,窮人也玩得起。
一個月後論文發表,學術界隨之轟動。在每年數十萬篇新發表AI論文中,YOLOv4的引用數迅速躋身2020年全球第三位,僅次於Google的Vision Transformer模型與OpenAI的ChatGPT3兩篇論文。
「他絕對是過去六、七年台灣AI學研界最重要的人之一,」人工智慧學校校務長蔡明順觀察。
來自台灣的小團隊,如何與有數十億美金資金支持的全球研究團隊並駕齊驅?
答案要追溯到2018年。當時,科技部長陳良基力推「業界出題,學界解題」的AI發展策略,廖弘源接下了一個看似平凡的任務:透過義隆電子裝在桃園的交通攝影鏡頭,解決塞車問題。
然而,這個任務隱藏著一個巨大挑戰——影像資料量大,雲端設備又昂貴,傳送儲存還有資安疑慮,所以得在邊緣設備端(如路邊攝影鏡頭)處理。但邊緣設備算力有限,如何進行複雜的AI運算?
用廚房來比喻,影像資料就像是大量食材,需要一個超大冰箱(雲端設備)來存放;但這樣既貴又慢,餐廳希望能將食材存在店內的小冰箱(邊緣設備)。然而,店裡的小冰箱(硬體)功能有限,只有大冰箱的5%容量。
面對這個難題,廖弘源跟團隊靈機一動:「我們要設計一個更好的演算法,降低成本,取代硬體運算的功能。」他不是去買更大的冰箱,而是想出一個聰明的料理方式(演算法)!
然而,哪個演算法的影像運算既快又好?王建堯尋尋覓覓,發現了YOLOv3。
與俄羅斯工程師攜手合作
YOLO的全名是「You Only Look Once」(你只要看一次),顧名思義,特色是用最少的運算資源,做最快的影像辨識。然而,這模型還是太大,裝不進邊緣設備的「小冰箱」。
「我們先動手做吧!」廖弘源找來幾位指導過的、已是教授的博士生,跟王建堯一起發展新的運算架構,最後推出了既能提高運算速度、又能維持精準度的CSP Net。
這個突破很快引起國際注意。當時DarkNet維護者、俄羅斯工程師博科夫斯基(Alexey Bochkovskiy)立刻邀請王建堯一起開發YOLOv4。一個跨越半個地球的AI軍團,悄然成形。
在新冠疫情蔓延的2020年初,當多數人們被迫居家,王建堯卻將自己關在實驗室,日以繼夜地測試模型速度;他的勤奮加上廖弘源的經驗,最終誕生了YOLOv4。
最少的資源,最快的影像辨識
YOLOv4的成功只是開始。為不使外界覺得只是僥倖,廖弘源團隊在四年內接連推出YOLOR、v7、v9版本,每一版都有核心理論及論文佐證,而且全數開源。現在,這些模型已被廣泛應用於各行各業,如交通管理、醫療診斷、農業監測,甚至國防領域等。
「2020年之後,物件偵測領域就是台灣的天下,」廖弘源自豪地說。
廖弘源與王建堯全力鑽研YOLO,且成功應用到國防、農業等領域。圖片來源:賴永祥攝
用AI讓台灣被全世界看到
「很少團隊像他這麼專注在同一個領域,」蔡明順解釋,許多研究者發一篇論文就換主題,廖弘源團隊卻不斷精進,「這代表YOLO不只是一篇論文,也是業界常用工具,使用者要求更精準、更低耗能。」
廖弘源和王建堯的成功並非偶然。儘管年齡相差近一倍,但能力和經驗恰好互補。沈默寡言的王建堯是本土博士,基礎功紮實;幽默風趣的廖弘源則是留美歸國,有30多年影像研究和實務經驗。「沒有他,我不可能做到;沒有我,他也不可能做到,」廖弘源這樣評價兩人組合。
更重要的,是廖弘源獨特的研究理念。一頭銀髮、人稱「老頑童」的他,選擇了一條少人走的路——當多數人追求論文發表量,他卻一心想解決重要問題。
他常提醒學生,「工程師用既存的方法,解決當下的問題;科學家用系統化的方法,解決長遠的問題。」
因為,只要能解決關鍵問題,即便短期無法產出論文,但遲早會迎來石破天驚的成果。而YOLO一役,不只應證了廖弘源的理念,更將他的團隊推上全球AI影像研究的巔峰。
廖弘源團隊完成此一大作後,挖角邀約不斷,但他不為所動;甚至還因擔心技術被壟斷,婉拒與大企業深度合作。這樣一位不在意物質回報的世界級學者,卻在今年欣然接下「晶創計畫」副執行長重任,扛下台灣下階段的AI國家級計畫。
「用AI讓台灣被全世界看到,是很好的方法!」在全球AI競賽中,廖弘源早已洞悉:勝利不在於資金多寡,而在於創新的力量。
「真正的強者,是強到國際都擋不住,那才叫強!」在他的願景中,台灣不僅要鞏固半導體霸主地位,更要插上AI的翅膀,翱翔於「軟硬整合」的新天地。
小檔案|廖弘源
中研院資訊所所長廖弘源。圖片來源:賴永祥攝 圖片設計:未來城市
- 出生:1959年
- 現職:中研院資訊科學研究所所長
- 學歷:美國西北大學電機博士
- 經歷:中研院資訊所研究員、交大資工系、成大電機系合聘教授
- 榮譽:國際電機電子工程師學會會士(IEEE Fellow)、國科會傑出研究獎、教育部學術獎
延伸閱讀
深度專題|台灣AI 20
「AI即國力」在2024年已成共識。進入新時代,天下「未來城市」推出了「台灣AI 20」專題報導,邀請產官學代表組成推薦委員會,選出20位在AI的技術創新、產業應用、政策推動、知識教育和社群連結五大領域中,選出20位對台灣AI發展有重大影響的人物。
誰是台灣AI 20人物?他們為台灣做了哪些事?立刻點擊閱讀「台灣AI 20」深度專題。





