武漢肺炎是人造病毒還是SARS?有特效藥?杜奕瑾AI團隊解答你最擔心的四個問題

武漢肺炎是人造病毒還是SARS?有特效藥?杜奕瑾AI團隊解答你最擔心的四個問題

美國CDC模擬的新冠病毒 圖片來源:美國CDC

43258
文・陳芳毓 圖・Taiwan AI Labs 台灣人工智慧實驗室

「關於武漢肺炎,AI能做什麼?」疫情爆發後,這個問題就困擾著PTT創辦人杜奕瑾領軍的台灣人工智慧實驗室。

人工智慧需要大數據做基底,然而武漢肺炎屬高度傳染疾病,多數國家都將資料鎖在P4等級實驗室,而個案最多的中國也不公開資料,使AI技術英雄無用武之地。

除夕前兩天,杜奕瑾與實驗室的醫療基因組開會,決定還是要「做些什麼」—這個11人小組,除了台大教授與幾位醫師,其餘都是生醫背景的跨領域工程師。

經過整個年假的線上討論,開工後四天,他們便火速用人工智慧解開大眾最好奇的四個問題:

1. 武漢肺炎是SARS嗎?

2. 新冠狀病毒來自蝙蝠嗎?

3. 新冠狀病毒是「人造」的嗎?

4. 武漢肺炎有藥可醫嗎?

「很多國家在做類似研究,」杜奕瑾承認,但多是生物領域的專家,「所以我們有些優勢是別人沒有的,比如運算能力與速度。以基因病毒研究演算法來說,應該是全世界最快。」

【延伸閱讀】自製「超商口罩地圖」的工程師:地圖上線6小時,我收到60萬Google帳單

圖片來源:微軟

想回答這四問題,第一步,得先打底。

早在2018年,台灣人工智慧實驗便與台灣微軟共同發表了「基因分析平台TAIGenomics」。透過微軟的雲端運算資源,運用自然語言理解,建立全世界第一個基因序列、病毒序列、疾病、用藥、症狀的醫療文獻知識庫,讓AI閱讀全球3800多萬篇醫學文獻,協助醫師與學者研究基因相關疾病,以推動個人化精準醫療。

其中,基因上最容易產生突變的「變異位點」,是精準醫療的關鍵資訊。因此,基因分析平台還設置了Variant2literature—一款以基因變異位點與疾病關係文獻搜尋引擎。

然而,人類全基因上有500多萬個變異位點。過去,研究者必須一一將可能的變異位點輸入資料庫,比對3000多萬筆文獻資料,找出可能資料後,再一筆筆下載、點開閱讀,相當耗時。

【延伸閱讀】李友專:過程跟結果都重要!精準與預測醫學使更多數據被留下

為加快研究速度,這一次更加入20多萬篇與這次病毒研究相關的醫療論文。只要輸入「Wuhan」(武漢)「coronavirus」(冠狀病毒)等關鍵字,不但會跳出相關文獻,還以紅字標示文中提及的基因、變異位點等訊息,節省查找的時間。

為加速找出解方,台灣人工智慧實驗室上週起開放基因分析平台與搜尋引擎,免費給全球研究者使用。「與其用傳統的分析工具,不如結合台灣最先進的人工智慧分析,讓成果能更快分享給世界。」杜奕瑾說。

為測試這個基因資料百寶箱的能耐,基因團隊率先開始從中淘金解題,同時驗證坊間傳言的真偽。

問題一:武漢肺炎就是2003年的SARS嗎?
答:錯,兩種病毒相似度僅82.3%

去年12月中國傳出疫情時,一度也傳出「武漢肺炎就是SARS」,勾起人們對17年前的恐怖記憶——戴口罩、隔離、封院、死亡,恐懼隨即引爆口罩搶購潮。

SARS全名是「‎嚴重急性呼吸道症候群」,武漢肺炎與2003年的SARS有許多相似徵狀;然而,武漢肺炎就是SARS嗎?

答案,得從病毒株的基因排序來找。

做病毒株親緣關係分析,需要好幾天;但透過基因分析平台,研究者只要一鍵上傳手上的病毒株基因序列,3分鐘,演算法就能算出病毒的親緣關係,還能用樹狀圖或圓盤圖做視覺化呈現;距離愈近,關聯愈強,親疏一目了然。

在智慧醫療基因組負責商業開發的林玉祥強調,高傳染性疾病每天都有新感染者,傳染過程中,病毒株也會不斷變異,「治療是分秒必爭,如果很快能算出病毒來源,就愈容易鎖定治療方式。」

【延伸閱讀】AI預測:北京危險係數高於武漢

2月5日前,全球共享禽流感數據倡議組織(GISAID)只公布67個病毒株,其中一株來自台灣(註:截至2月15日已累積171株病毒序列,其中三株來自台灣)。比較MERS、SARS、蝙蝠與新冠病毒的基因序列後,可以透過樹狀圖發現(上圖),與新冠狀病毒最近的是SARS,其次是蝙蝠,最後是MERS。

尤其是SARS,與新冠病毒的S蛋白質有三處明顯差異(下圖,圈起處),相似度僅82.3%。「只能說與SARS很相似,但並不相同,」林玉祥解釋。

問題二:新冠狀病毒是從蝙蝠來的嗎?
答:對,可能是來自中菊頭蝠。

既然新冠病毒不是2003年的SARS,它到底從何而來?

一開始矛頭指向武漢華南海鮮市場的野味;後來傳出是蝙蝠、果子狸,世界衛生組織甚至一度認為是蛇。

答案還是要回到基因序列。那種病毒與新冠病毒的相似度高於82.3%?

【延伸閱讀】二月專題|科技防疫:與武漢肺炎競賽的黑客松

台灣人工智慧實驗室再度將台灣的這株新冠病毒株,與已知的病毒序列比對;發現有一株病毒與其相似度高達96%—這株病毒是2013年採樣自一隻中菊頭蝠,一種分佈在中國南方與東南亞的蝙蝠。

這個實測結果,也與世界衛生組織2月11日發布的報告相符——「愈來愈多證據顯示,新冠病毒與其他蝙蝠冠狀病毒的關聯,尤其是菊頭蝠的亞種(Rhinolophus bat sub-species)」。

中菊頭蝠

問題三:新冠病毒是人造的嗎?
答:難以確定。

然而,新冠病毒與蝙蝠的基因序列有96%相似度,能否斷定蝙蝠就是病毒來源?

17年前,被視為人類與SARS中間宿主的果子狸,身上所帶冠狀病毒與SARS相似度高達99.7%。也就是說,96%相似度不算特別高,還有1100多個核苷酸不一樣。

林玉祥說,團隊認為,大自然至少要經過20年演化,才能造成這種差異。也就是說,若新冠病毒是自然演化的結果,除了蝙蝠,應該有尚未被發現的中間宿主。

反過來說,若始終找不到這個「宿主」,便難排除病毒是「人造」的可能。

1月底,印度團隊發表論文指出,武漢肺炎與HIV病毒有高相似度,認為可能是「人造」,但隨即引發強烈質疑。

台灣人工智慧實驗室假設,新冠病毒若是人造,目的應是想創造比SARS與人類基因更緊密結合的「超級病毒」,擴大傳染力。但實驗結果發現,新冠病毒與人類基因的結合穩定度並不如SARS(如下圖),故難斷定是人造病毒。

儘管如此,也無法證明病毒絕對非人造。事實真相,可進一步從相關序列找尋相關醫療論文研究佐證。

問題四:武漢肺炎有藥可醫嗎?
答:有,且有尚未發現的新藥。

藥物是否有效,得看藥物分子與病毒能否鍵結(docking),產生作用。

藥物研發之所以往往耗費十多年,其中約有三分之一時間,是花在將藥物小分子與病毒的鍵結上。但人工智慧能將藥物分子結構,與病毒模擬結合,能替研究人員縮短三、四年的摸索。

日前,泰國與美國醫療團隊已分別傳出找出解藥。泰國使用的是原用來治療愛滋病的蛋白酶藥物Lopinavir/Ritonavir,美國則用治療伊波拉病毒的多蛋白藥物Remdesivir。

除此之外,還有別的解藥嗎?

台灣人工智慧實驗室列出13種可能治療武漢肺炎的藥物。

台灣人工智慧實驗室裡有醫師背景的工程師團隊,找出與泰、美團隊研究相關的13種藥物,再將它們的小分子結構,一次次與病毒對接。若分子結構能穩穩嵌在病毒結構中,便代表該藥物有療效。

在人工智慧的模擬圖中,新冠病毒的蛋白質結構彷彿一顆閃著蒂芬妮藍的愛心,泰、美團隊建議藥物的小分子,都被緊緊包覆其中(如下圖)。

「更興奮的是,有一種接合力最好的藥,還沒有人談,」林玉祥說的是一款名為Indinavir的蛋白酶藥物(如上圖),與病毒接合程度最高,卻尚未出現在任何報導中,值得藥物與疫苗開發單位參考。

藥物小分子緊緊接合在新冠狀病毒的蛋白質結構中。

這是台灣人工智慧實驗室首度使用基因分析平台系統,分析一個未知的新疾病,「過程非常順暢!」杜奕瑾認為,過去一個月,政府致力於防疫;疫情穩定後,工作重心將逐漸轉移到藥物與疫苗研發。團隊除與國家衛生研究院合作,更期望拋磚引玉吸引更多相關單位攜手研究,透過這次疫情,讓全球看到台灣智慧醫療的實力。

未來城市@天下編輯部

尋找在城市幸福生活的所有可能

《未來城市》是《天下》於2018年推出的智慧科技與設計交流平台。 ​​透過報導智慧城市、社會設計、專家洞察,期望成為一個提供市民、企業和政府單位對話的平台。

延伸閱讀