為何PTT上的假訊息比FB易被發現?杜奕瑾分析演算法差異給你看

為何PTT上的假訊息比FB易被發現?杜奕瑾分析演算法差異給你看
未來城市Podcast EP.16未來大來賓:Taiwan AI Labs創辦人杜奕瑾。圖片來源:未來城市編輯部 設計:李芸
2021-12-20
整理・許鈺屏
39371
他是網路論壇PTT「創世神」,也是台灣人工智慧實驗室(Taiwan AI Labs)創辦人——杜奕瑾如何藉AI人工智慧,在病毒與假消息爆發的疫情期間,快速掃描、解決問題?

採訪當日,杜奕瑾剛從歐洲返台、隔離出關——他與國發會主委龔明鑫領軍的中東歐經貿考察團參訪斯洛伐克、捷克與立陶宛等國,簽下生醫、半導體等產業合作備忘錄,也分享了台灣的科技防疫。

疫情爆發初始,台灣人工智慧實驗室便以AI速讀新冠病毒與基因變異的關係;針對與疫情同樣盤旋不去的社群媒體假訊息——Taiwan AI Labs提出的「葉黃素計劃」做了什麼事?新APP「迷因Miin」又是什麼?AI進行中的各種專案,讓杜奕瑾解釋給你聽!

科技防疫、防堵假消息都可以!杜奕瑾用AI做了什麼事?

未來城市Podcast EP.16|為何PTT上的假訊息比FB易被發現?杜奕瑾分析演算法差異給你看

▹ 未來主持人:未來城市頻道總監 陳芳毓
▹ 未來大來賓:Taiwan AI Labs創辦人 杜奕瑾

▹ 訪談精華一次收藏:

杜奕瑾-Taiwan AI Labs-人工智慧-葉黃素計畫-社群平台-言論審查Taiwan AI Labs創辦人杜奕瑾藉由「葉黃素計畫」,讓科技剖析社群平台的透明度及中立性。攝影:未來城市編輯部 設計:李芸

Q:台灣人工智慧實驗室在智慧醫療,投入非常多研究;除了以AI找出新冠病毒的突變點、也找出可治療新冠肺炎的藥物。這一年,你們有哪些智慧醫療的進展?

2017年起,AI Labs就做基因相關研究,利用人的病史、遺傳基因訊息,推測癌症研究。疫情期間,AI Labs算是很早就知道它跟SARS有關。台灣為什麽這次反應特別快?一個原因就是李文亮醫師的報告,當他在其他社交媒體被下架時,台灣PTT完整保存、討論了它的內容;台灣疾病管制署看到診斷報告後,也很快採取行動。

AI Labs在2019年12月31號也注意到這個消息,但一直都沒有拿到病毒株定序。一月中拿到定序時快速做了分析,發現這個肺炎的嚴重程度可能與SARS不相上下,當時就有某程度的理解。

二月初疫情開始爆發,我們從基因定序結果推測它的棘蛋白——研究病毒如何結合到人體;並再思考有沒有辦法用人工智慧,找出可用的抑制劑。我們算是世界第一個用這種方法把可能的抑制劑算出來的實驗室。

我們把常見的病毒藥物、通過FDA審核的藥物、其他健保藥物算出來,並參照「真實世界數據」(real world evidence),建構出網站「DockCov2.org」。我們也用人工智慧閱讀醫學論文,並秀在這個網站上,讓醫師不必一直追著論文看。

從老藥新用的大分析、人工智慧自動化閱讀醫療論文,我們整理好訊息,用開源方式讓大家使用——這也登上了世界頂尖的《核酸研究》(Nucleic Acids Research)論文。

AI Labs-DockCov2.org-Covid-19-人工智慧-AI-藥物-論文AI Labs利用人工智慧整理藥物資料、醫學論文,讓醫生可以直接閱讀經過整理的訊息。圖片來源:DockCov2.org網站

Q:疫情期間大家都很關心醫療資訊,但民眾焦慮時難辨真假,導致社群媒體的假新聞相當活躍。你們的「葉黃素計畫」做了社群平台中立性、透明度的研究分析,談談這項計畫做了哪些事?

我們發現,所有民主國家在疫情爆發時,社交媒體平台上的假消息也同時爆發。我們與國際組織合作,在網站「Covirus.cc」列出與國際合作的開放開源計畫,其中一個就是「Infodemic」(「資訊」information與「疫情」pandemic合成的新字)。

國際組織都很好奇假消息從何而來,尤其對中文假消息特別有興趣。不少報章媒體、無國界記者組織都提到,台灣是假消息的第一線。當他們引述到PTT的角色,就會來找我們討論、分析。

最早的分析,我們研究中國社交媒體,尤其是微博、微信上的消息。在言論管制嚴謹的國家,消息「選擇」的速度很快,也就是要偵測的東西很快就會被偵測到,像李文亮醫師的文章;但是,要煽風點火地散播也很快,而且是非常有節奏跟策略性地散播。

自由的網路區域,如Facebook、Twitter、PTT或Dcard也會匯集、流動這些訊息。我們想來看這些平台如何應對假消息,便針對這些社群平台,找出言論控制的蛛絲馬跡,就能解析背後運作、找出平台資訊透明度的分析。

Q:例如臉書上,有些敏感字眼的貼文會被隱藏,我們幫這種現象取了專有名詞:「被祖克柏擋住了」「被祖」,你們如何思考這件事?

我們在思考,為什麽在台灣使用社群平台,它的部分下架原則卻與中國的邏輯有些關聯?

例如,我們做科技防疫,但張貼AI Labs的國際論文、國際媒體對台灣防疫的報導、台灣加入WHO或「Taiwan Can Help」等字眼的貼文時,觸及率會特別低,甚至沒有觸及。反觀臉書上普遍的一頁式詐騙、虛假農產品宣傳文,無論如何檢舉都不太有用。

為什麼臉書在某些事情上反應特別快?如果從個案觀察,容易流於主觀偏見,所以,我們想做一個開源的「葉黃素計畫」。

這個計畫讓使用者可以在Chrome瀏覽器插入外掛,找出貼文被下架的原因、同時貢獻這項資料,讓我們做學術性分析。統計300多篇被下架的文章後,發現只有三篇是違反色情守則;其他遭下架的貼文,最多的關鍵字反而是中國、台灣、印度與香港。

葉黃素計畫-AI-人工智慧-臉書-言論審查-文章下架-文字雲「葉黃素計畫」分析被臉書下架的文章,依貼文關鍵字出現次數整理成文字雲。圖片來源:截自葉黃素計畫網站

例如,香港相關事件不斷發生,包括知名民運領袖被判刑、黎智英的新聞,在臉書上的聲量變得很小。

對照臉書的社群守則,接近98%言論都不該被下架,在台灣都屬於言論自由範疇。這就是我覺得非常有趣的地方——當我們在說要反仇恨言論跟反假消息時,其實我們無形地賦予了平台的審查權。但是平台的審查權到底審查了什麽?我們有沒有去了解?

進一步看相關紀錄片,例如《編碼偏見》(Coded Bias)和《網路清道夫》(The Cleaner),就提到這些社群媒體雇用大量人員去做言論審查——但他們可能受到所在地的風土民情、生活習慣,造就審查偏見。

例如,這個人生長在極權國家,他的審查標準就會符合極權國家的標準;若在民主國家、從小使用PTT,他的言論審查標準就大有不同。

Q:對比PTT,上面也以有不同立場、政治觀點的人在討論,甚至也有不真實的訊息。PTT跟臉書又有什麼不一樣?

PTT跟臉書都會有假訊息,不一樣的是,PTT並沒有一個演算法,去為了平台本身利益的最大化而選擇新聞、植入廣告。

紀錄片《智能社會:進退兩難》(The Social Dilemma),就提到為什麽使用臉書容易遇到同溫層,或變得焦慮跟極端,其實這與平台演算法設計有關。

紀錄片告訴我們,社交平台若讓使用者黏著度、回看率最大化,並讓使用者兩極化、讓他看自己所相信的消息——這樣,平台就會得到最大的廣告利益。

但PTT並非營利組織,我們的成立宗旨就是公正、開放的訊息交流平台,所有的演算法都是開源的;你看到的PTT內容跟我看到的也是一樣的,不會有客製化的排序。

另一個很大的不同在於臉書的內容制度,它有一個「神」一般的角色,也有權刪除言論,修正機制較不透明。

但PTT是由使用者選板主、板主制定板規,再依照板規刪除文章;若板主不依照板規,就會被憤怒的使用者罷免。相對來講,較有民主跟抗衡的機制存在。

你可以看到,現在大家在檢討假消息或仇恨言論,以PTT經驗來看,我們其實從不強調事實查核。

Q:為什麼PTT不強調事實查核?

因為,很多時候你認定的事實,並不是真正的事實。

例如,伽利略說地球繞著太陽運行,卻被視為異端、發布假消息,到100年後才發現地球真的繞著太陽轉;再看李文亮醫師發表的訊息,所有媒體都說是假消息、立刻被下架——只有PTT沒下架,因為我們不是由一個人決定要不要下架。

我認為,訊息被充分討論是很重要的,但應該思考討論機制是否秉持中立客觀原則、不被操弄。這也牽涉到我們後來的訊息操控研究,我們也試著用AI整理世界上發生的事,再比照我們在社群媒體看到的內容是否一致。

Q:這是不是與你最近和台大資工系教授陳縕儂合作的APP「迷因Miin」有關?

「迷因Miin」堆疊了我們之前研究。我們曾做「記者快抄」,練習用人工智慧寫新聞,減少新聞內容裡過多的煽動與不必要的情緒。

後來我們發現,新聞媒體與社群平台都有立場,也可能有偏見,重點是提供一個能看到全方位資訊的方法,讓一個事件能自動、全面向地呈現理解的管道。

納入全方位的觀點後,就可以反過來看哪些人或媒體隱惡揚善,也能知道誰多講了什麼、少說了什麼——從這個角度,我們完成了「島民衛星Islander」計畫。

「記者快抄」加上「島民衛星Islander」,就變成了「迷因Miin」。

AI Labs-Miin-迷因-人工智慧-新聞-APP-AI記者AI Labs結合先前的研究成果推出Miin APP,以人工智慧整理媒體、社群平台消息再自動寫成新聞。圖片來源:截自Miin APP

很多人看臉書是要看到最新消息,不見得是跟社群互動。但若透過臉書看消息,很容易接收境外的認知操作、影響選擇。所以我們很好奇,若人工智慧能全面了解一件事、並自動寫成一篇新聞,那是什麼樣貌?

「迷因Miin」可以有效率地整理所有媒體、社群平台的內容,且報導量非常多,讓你快速知道台灣發生什麼事。這就類似我們讓AI幫醫師讀論文,再提供診斷建議。

使用「迷因Miin」時,我的情緒平和、不憤怒,但看到的資訊量多元、也比臉書大;回到臉書,我關注到仇恨、極端言論居多,整體訊息量較少。使用者可以使用、對照「迷因Miin」和臉書,找出閱讀感覺的差異。

聽懂未來:關於AI科技,我還想知道更多⋯⋯

AI科技是什麼?台灣有哪些科技防疫的案例?未來城市給你更多知識補充包!

是人造病毒還是SARS?有特效藥?杜奕瑾AI團隊解答你最擔心的四個問題
「打疫苗變萬磁王」謠言源頭找到了!醫師反疫苗,吸金近6000萬|黑化科學家系列
境外移入案例頻傳!AI如何找出最高風險感染者?
讓國旗登上WHO主辦的黑客松!AI秒讀新冠肺炎X光,成大擊敗全球1000多隊奪勝
如何在疫情期間分配口罩?專訪台灣數位政委唐鳳

想聽更多未來城市Podcast節目?

・首播時間:每個月第一、三個週一的傍晚五點。
・頻道搜尋:天下雜誌Podcast頻道「聽天下」,或關注未來城市網站「未來城市Podcast」系列內容。

馬上收聽:未來城市Podcast播放清單

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結