李建璋:捐資料就像捐骨髓,自己或許受損但絕對可以救人|未來招待所——智慧醫療

李建璋:捐資料就像捐骨髓,自己或許受損但絕對可以救人|未來招待所——智慧醫療
台大醫院智慧醫療中心副主任李建璋認為,台灣應該珍視數據資料庫優勢,促進資料科學研究發展。圖片來源:賴永祥攝
2021-12-24
整理.李芸、許鈺屏
15228
2021年末,「未來城市@天下」再次舉辦實體閉門會談「未來招待所」。我們讓日式老屋「無二會所」成為跨界交流的平台,並邀請醫療、科技業人物共聚,共同在古蹟悠然氛圍裡暢談智慧醫療。

這場會談以「醫院數位轉型和AI跨業協作」為題,前科技部長陳良基、台灣人工智慧實驗室創辦人杜奕瑾、台大醫院急診醫學部主治醫師李建璋、戴爾科技總經理廖仁祥與技術副總經理李百飛輪番與談,分頭從AI與醫療合作模式、健康數據實戰經驗及未來趨勢等面向,想像台灣智慧醫療的未來。

李建璋-未來城市-未來招待所-台大醫院-智慧醫療-數據-醫學資料未來城市閉門實體會談「未來招待所」,打造智慧醫療的跨界交流平台。圖片來源:賴永祥攝

以下,是台大醫院急診醫學部主治醫師暨智慧醫療中心副主任李建璋的分享:

醫學資料的力量是什麼?

當倫敦爆發霍亂、許多人都認為是透過瘴氣(Miasma)、飛沫傳染時,流行病學之父、倫敦麻醉醫師約翰・斯諾(John Snow)標註了死亡者的居住地,推測霍亂是透過水傳染。30年後,生物學家發現是霍亂弧菌作祟,才還他一個公道。這個故事說明資料的厲害——實驗科學家、生命科學家都還不知道怎麼回事,資料就已經可以發現事實,已經可以救人。

常用抗生素導致主動脈破裂?從數據找解答

時空平移到2010年,我身上也發生類似故事。2011年我去哈佛讀流行病學博士,藥物流行病學就是利用大數據研究;我的老闆是美國用健保資料庫,幾千萬人級的大資料庫開始做研究的先驅。

當時,有一位泌尿科醫師開給前列腺發炎的阿伯「氟喹諾酮類抗生素」(Fluoroquinolone),這是很常見的抗生素。結果回診時,醫師發現阿伯的左腳腫起來,阿基里斯腱斷掉。阿基里斯腱是我們全身膠原蛋白最強的地方,通常精英運動員、劇烈運動的人才會斷裂,一個阿伯沒什麼劇烈運動,怎麼無緣無故就斷掉了?後來又出現第二個、第三個病例,於是大家開始懷疑是不是跟氟喹諾酮有關。

這需要做一個大規模、有對照組的研究,同樣是老先生、同樣前列腺發炎,沒有吃這種藥、沒有產生阿基里斯腱斷裂;大數據累積起來,才能證實兩者之間的因果。我的師兄就利用美國健保資料庫,第一個證實這件事情。

回台灣之後,我繼續想這個問題。因為主動脈就是由膠原蛋白構成,氟喹諾酮讓阿基里斯腱的膠原蛋白斷掉,那怎麼不會讓主動脈破掉呢?

這需要有人證實,如果我們最常吃的抗生素竟會讓大血管破掉,那是天大地大的事。但為什麼沒人研究?主動脈剝離和主動脈瘤(Aortic Aneurysm)在人群的發生率是十萬分之7至30,其中有吃過氟喹諾酮的人更少。也就是說,必須要累積上百萬、上千萬的人,花好幾年才看得到資料。

這就是台灣健保資料庫的力量。環顧全球,加拿大與北歐國家也有大型、長期追蹤的資料庫,但由於他們醫藥分業,串不起藥和醫的關係;只有台灣,一個資料庫裡有醫、有藥、有診斷、有死亡,雖還沒有實驗室資料和影像數據,但是夠用了。

很快我們就證實,氟喹諾酮至少會增加75%左右的主動脈剝離發生率。這件事造成轟動,但美國食品藥品監督管理局(FDA)回應,這些事情可能只是數據、資料的聯想,並無實證支持。

但其他國家不這麼想。加拿大也利用健保資料庫,看到一樣的結果;瑞典的卡羅林斯卡學院也用瑞典資料庫做了一次,得出1.44倍到2.5倍的結論;法國也有資料庫,得出二到三倍。這件事情變得非同小可,並不是只有我個人的觀察,其他國家也都看到了。

美國德州心臟學研究所是全美處理最多主動脈剝離病例的醫院,雖然不曾在動物實驗發現這種現象,但他們決定相信資料科學,改變動物模型。

他們先餵老鼠三個月的高脂肪食物,再打三個月血管升壓素,形成高血壓、高血脂狀態;重做實驗後,打抗生素的老鼠主動脈統統破掉。後來,FDA也接受我們的看法。

氟喹諾酮-Fluoroquinolone-抗生素-FDA-主動脈剝離-使用風險-智慧醫療-數據醫療經實驗證實,FDA接受數據分析結果,發布氟喹諾酮的使用警訊。圖片來源:截自美國食品藥品監督管理局網站

先數據、再實驗的典範轉移

以前在資料裡找出關係,人家會說你在釣魚,沒有理論基礎就亂撈;現在典範轉移、顛倒過來。資料科學家能看到的事情比實驗科學家還早,如果實驗科學家好好跟隨資料科學家,他會有新的醫學發現。

美國哈佛大學生物統計學系的前主任林希虹曾說,現在的世界「It is data first.」。先不用假設,只要嚴謹分析和高品質數據,會比所有實驗科學家更早看到問題。先從數據找到結果,再去設計實驗,假說要跟隨數據,這是一個大的典範轉移。

以抗生素的案例來看,我們也利用健保資料庫,在電腦前打程式就改變了世界;這就是台灣資料的力量,千萬不要小看。(延伸閱讀|台灣醫療AI產業的「微笑曲線」,出了什麼問題?|李建璋專欄

丹麥、英國用自己的資料庫找出新冠的秘密

沒有國家像台灣這麼幸運,同時擁有三座金山——健保資料庫、電子病歷和中研院的人體生物資料庫。事實上台灣的電子化比美國更早、轉型更徹底,醫院大大小小的事都在電腦上完成;可是,現在這三座金山都不得其門而入。

其實各國利用不同金山,在疫情中做了不同事。例如,丹麥的金山是健保資料庫,AZ上市第三期時沒人知道會產生血栓,他們就利用資料庫證實;美國的電子病例資料庫,利用人工智慧的聯盟式學習,可以很快預測死亡;英國的金礦是生物樣本庫(UK Biobank),他們發現新冠病毒的易感基因,得出血型O比較容易存活、血型A很快死亡。

在台灣,台大智慧醫療中心有六個工程師。五、六月疫情來襲,需要快速判讀X光片,我們利用當時網路上一萬8,000張公開資料,很快建構X光模型,不只可以判斷肺部變化,還可以算出是罹患新冠肺炎的機率與嚴重程度。只要有資料,很快就可以做出系統。

肺部X光-新冠肺炎-AI診斷-人工智慧-台大智慧醫療中心-數據-智慧醫療疫情期間台大智慧醫療中心利用公開資料,設計可識別肺部X光片,快速判斷染疫狀況的系統。圖片來源:截自台灣人工智慧實驗室網站

大家知道,AI科學家李飛飛創建了視覺資料庫(ImageNet),過去要教電腦看懂世界,都先標註圖片,再讓電腦學習,可是進步很慢。李飛飛看著她的兩個小孩,即使沒有告訴他們這是鳥花魚獸,為什麼小孩很快就能辨識世界上的萬事萬物?為什麼不用一一標註,人類的視覺就能夠辨認?

所以她覺得,神經網路學習任何物體時,若像小孩先把萬事萬物學懂,再訓練就會很快,這是「Pre-training」的概念。於是她請大家貢獻資料、形成視覺資料庫,現在上面有十幾億張各式各樣的照片,先讓神經網路學習,未來訓練就快很多。(延伸閱讀|​​重量級人工智慧專家李飛飛:我希望AI保持謙卑,因為它不是萬能

「擁有資料」的是個人,「決定資料怎麼用」的是代理人

現在的醫療世界沒有視覺資料庫,但台灣處在最有利的位置。因為,台灣健保申報需放上影像,健保署有這麼多影像資料,只要解放資料,就能做出醫療視覺資料庫。大家以後先去資料庫訓練模型,再去學習任何醫學影像,台灣做出的模型就會比別人厲害很多、快很多。

可是,由於代理人的觀念,我們把台灣的優勢鎖起來了。

電子病歷資料、健康資料應該是病人自己的,但決定資料可不可以用卻是代理人。資料科學家希望資料開放,如果你問我個人的資料要不要捐給人家分析,我也覺得沒問題;可是,當我變成倫理委員會審查委員時就換了腦袋,人家來要一千張、一萬張資料,我也會擔心。

不管是倫理委員會、健保署或是法律專家都好,代理人出發點不是壞的,因為他要保護隱私;但在資料科學世界裡,沒人敢保證能百分之百保護隱私,但可以救人。

所以我們可以怎麼做?像是當年慈濟上人呼籲大家捐骨髓,捐資料跟捐血、捐骨髓一樣,捐了你可能會受傷,可是別人可能獲利、可以救人。要是有「上人」再站出來,叫大家把資料捐出來,這個事情立刻解決(笑)。今天用這個結論,鼓勵大家都把自己的資料捐出來,台灣的資料科學就立刻起飛。

2021未來招待所・醫院數位轉型和AI跨業協作

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結