民視、光禾感知攜手推AI主播!AIGC虛擬人物還有哪些商業應用?

民視、光禾感知攜手推AI主播!AIGC虛擬人物還有哪些商業應用?
未來城市Podcast EP.63 未來大來賓:光禾感知科技創辦人暨執行長王友光(左)、民視新聞傳播群副總經理胡婉玲(右)。圖片來源:未來城市
2023-08-28
整理・許靜之
34782
今年六月,民視與光禾感知聯手推出台灣首位AI主播「敏熙」,開啟討論熱潮。

「敏熙」在民視報導國際氣象,隨著觀眾接受度上升,產品代言、活動主持邀約蜂擁而至。AI主播上工將滿兩個月,民視與光禾感知如何打造AI主播?未來可能還有哪些商業應用?

未來城市Podcast EP.63

▹ 未來主持人:未來城市頻道總監 陳芳毓
▹ 未來大來賓:民視新聞傳播群副總經理 胡婉玲、光禾感知科技創辦人暨執行長 王友光

▹ 訪談精華一次收藏:

新科技-民視AI主播-敏熙-生成式AI-人工智慧-光禾感知科技-王友光-民視新聞-胡婉玲-科技趨勢-電視新聞產製-AI應用民視新聞傳播群副總經理胡婉玲指出,「敏熙」是生成式AI應用於電視新聞的實例。圖片來源:未來城市

語言模型-民視AI主播-敏熙-生成式AI-人工智慧-光禾感知科技-王友光-民視新聞-胡婉玲-科技趨勢-電視新聞產製-AI應用光禾感知科技創辦人暨執行長王友光期待能借助民視資料庫,訓練出多語言轉換的大型模型。圖片來源:未來城市

問:生成式AI在新聞媒體有許多應用案例,民視為什麼決定打造AI主播「敏熙」?「敏熙」在民視負責哪些工作呢?

胡婉玲(以下簡稱胡):電視新聞仰賴科技來呈現報導內容,所以很容易就會想到要推AI主播。就像早期電視新聞背板是實景,現在我們有了藍幕、綠幕技術,還有SNG衛星轉播車,這些都是科技運用在電視新聞工作的實例。

在三、四年前,外媒就有打造AI主播的嘗試,但當時技術普遍不夠理想,所以沒有跟進。去年光禾感知與民視接觸後,我們順利談成合作,克服技術困難,相當不容易。

「敏熙」進駐民視最重要的無線台和新聞台,剛開始還不敢讓她承擔重責大任,先從播報國際氣象開始,一邊做,還要一邊學習修正。

問:民視找到光禾感知合作打造AI主播後,歷時多久才讓「敏熙」誕生?

王友光(以下簡稱王):光禾感知是研究型技術公司,經常與民視視覺創意中心交流相關技術。去年十月我純粹想炫耀,展示我們做出的AI主播;他們看完後的反應比我預期中還大,說有應用價值,應該給長官看看。

原本我以為電視台比較保守,沒想到幾天後,民視就說要繼續做下去。半年多來的合作經驗,讓我感受到民視是非常勇於突破的電視台,執行能力強,要求也非常高。

問:在討論過程中,雙方意見最不一致的地方在哪裡?

王:我們先請AI整理上百個亞洲藝人或主播的長相特徵,再挑出幾張適合擔任主播的臉孔。當時生成好幾位備選的AI主播,我們公司同事以男生居多,我們覺得最漂亮的一位被認為「長得太完美」,甚至不太像真人。

胡:那一位他們說長得像藝人Angelababy,不過平常我們就會培訓主播,我一眼看中的是敏熙。光禾感知團隊來到民視來展示,民視總經理、董事長和各部門一起看完後,全都一面倒選敏熙。敏熙長相清秀脫俗,帶有一點不食人間煙火的氣質,跟林青霞年輕時有幾分相似。

王:那天我們帶幾個工程師去民視,讓AI主播試鏡,一一到大螢幕上播報新聞。當時現場一陣討論,讓我發現新聞台長官們的偏好,好像跟我們工程師不太一樣,我們票選出來的那位主播,長相比較豔麗(笑)。

不過術業有專攻,他們看主播看了這麼多年,哪一個比較有觀眾緣,判斷會比我們準,最後市場也證明了這件事。

民視AI主播-敏熙-生成式AI-人工智慧-光禾感知科技-王友光-民視新聞-胡婉玲-科技趨勢-電視新聞產製-AI應用民視從國際氣象著手,讓AI主播敏熙進駐播報。圖片來源:截自民視新聞

問:AI主播可能在民視其他節目或活動上出現嗎?

胡:敏熙上線一個星期後,工研院想要找開場嘉賓,就邀請「她」去參加。我們把敏熙當作真人主播,可以主持專業節目或正式頒獎典禮,但是商業活動或代言就不需要,我們不會把敏熙當成IP來經營。我們是第一家推出AI主播的電視台,絕對要愛惜她,形象衝太快很容易陣亡。

王:敏熙剛上線,賣房子、賣面膜等各種邀約陸續找上門。我們討論過,以主播超然的形象,實在不能去代言產品,只好拒絕廠商的邀約。

胡:一開始推出敏熙時,在新聞評議自律會議上,就有資訊學者非常贊成,但也有學者表示反對。大家擔心,假人怎麼能算是主播?AI主播不會思辨,不能獨立下判斷,給她什麼稿子,她就說什麼話。優點是非常精準,她不吃螺絲、不耍脾氣;缺點就是不像是真人,不會有機靈的臨場反應。

因為市場反應多元,讓敏熙先播報國際氣象,也是避免搶走真人的工作。我們有一位專業氣象主播林嘉愷,但他不報國際氣象,所以就挪這一塊給敏熙做。

問:敏熙的聲音如何製作?是否有參照哪幾位主播的聲音呢?

王:我們跟微軟有長期合作,敏熙的聲音是微軟小姐的原聲,微軟處理文字轉語音(Text to Speech)的技術很厲害。

胡:我們會跟光禾感知討論,細修目前表現不夠理想的地方,例如播報山洪、淹水等情境的新聞,我們希望能調整語調聲音。另一方面,主播嘴型也必須隨著聲音一起調整,甚至進一步表現出細緻的臉部肌肉紋路。

我們不斷要求敏熙要進步,因為她是生成式AI,她可以學習,眼尖的觀眾應該會注意到,敏熙從第一天登場到現在,其實已經不一樣了。

王:光禾感知最大的收穫,其實是民視提供大量的4K高畫質影音資料。六月上線時,敏熙對嘴的效果還不是這麼好,因為我們之前訓練的資料多來自國外;無論我們怎麼訓練AI模型,它就是擅長英語生成,嘴形當然對不上。

後續用民視提供的資料訓練,每週都會發現敏熙持續在進步。民視的影音資料包括國語、英語、客語和台語;我們想要的結果,就是一個能做到語言轉換的深度資料庫,這將是全世界獨一無二的AI模型。

問:全球目前製作AI主播主要的技術有哪些?各自有什麼優缺點?

王:目前有兩種主流。第一種是全3D建模,在中國春晚登場的「虛擬鄧麗君」就一例,這需要建模師一筆一筆做出來,成本很高。好處是只要綁好骨架,你希望他旋轉、跳躍或後空翻都可以,屬於動畫技術的一種。

第二種AIGC,也就是民視AI主播使用的技術。我們把指令下給AI,經過GPU計算上億次後生成影像。今年算是大眾認識AIGC的元年,我認為這兩種技術短期內就會混合在一起,未來可能就會有部分採用建模、部分採用AIGC的應用方式。

問:推出AI主播「敏熙」之後,還有誰來找光禾感知合作?

王:從英語教學業者到銀行客服部門,都有跟我們接觸。英語教學業者要線上媒合真人家教,就問我們能不能做一個AI老師。不過這技術跟AI主播其實不一樣:敏熙的解析度有1080P,這麼高的影像品質,演算法需要時間跑,無法即時生成。線上師生要即時對話,不能用這麼高的影像品質,得找別的方式替代。

各產業看到敏熙後,都有各自的想像,但一開始通常不會知道會有技術差異。我都跟客戶說,我把軍火庫告訴你,先了解每一項技術能做到的事,再排列組合,應用在你的產業。雖然成功推出AI主播,不過要在另一個產業復刻技術,可能需要一段時間。

問:民視如何把關AI主播背後的新聞產製流程?

胡:我自己是主播出身,我觀察,AI主播進駐電視圈,會增加電視新聞播報的廣度與多樣性,讓觀眾更想留在電視上看新聞。而敏熙播報的內容文稿,有時是國際中心或國際氣象編輯台寫撰寫,有時是國內記者負責,都經過原有的審稿流程。

簡單來說,敏熙沒有什麼自己的個性,不會亂講話,她所播報的內容,民視必須負百分之百的責任,我們就是這樣幫她背書。

問:AI生成虛擬人物在近期內,還可能發展出哪些商業應用?

王:有些公司已有產品代言人,為達到更好的宣傳效果,就會與我們合作,把代言人轉換成AI形象——我們讓代言人在Instagram、Facebook或Line等社群通訊軟體上,能與客人聊天或介紹產品,打造「真人客服」。這種技術與AI主播不同,但大家少有機會和明星一對一聊天,AI技術讓粉絲有沈浸感,就能創造優良的客服體驗。

聽懂未來:關於生成式AI,我還想知道更多⋯⋯

未來城市給你更多知識補充包!

想聽更多未來城市Podcast節目?

  • 首播時間:隔週六播出。
  • 頻道搜尋:天下雜誌Podcast頻道「聽天下」,或關注未來城市網站「未來城市Podcast」系列內容。
馬上收聽:未來城市Podcast播放清單

其他人也在看

你可能有興趣

已成功複製連結