g0v獎助金獲獎專案(二)|國家寶藏:從美國檔案資料庫,挖20萬筆你沒讀過的台灣史

g0v獎助金獲獎專案(二)|國家寶藏:從美國檔案資料庫,挖20萬筆你沒讀過的台灣史
2019-10-29
圖、文・梁駿樂
4550
國家寶藏專案緣起於g0v美東黑客松,大部分成員都在美國,也在美成立「台灣國家寶藏基金會」(Taiwan National Treasure Foundation),翻拍檔案至今已累積50萬筆。心繫台灣的他們,在開放文化基金會有捐款專戶,並與國內研究機構合作。

2018年5月,國立台灣歷史博物館捐贈館藏的美國國家檔案館資料,給國家寶藏作開放資料運用,開創學界將採集檔案交給國家寶藏做開放資料的先例。國家寶藏將無限期在平台上開放台史博館提供的美國檔案,歡迎任何人使用這批檔案做營利或非營利用途。

「深刻感受到台灣人對自己的歷史不認識,」這是「國家寶藏」發起人蕭新晟運作計劃兩年後的最深刻印象。

對台灣史一直非常感興趣的他,2017 年憑著「國家寶藏」獲得「g0v 公民科技創新獎助金」,運用 OCR 的技術在美國國家檔案和記錄管理局(NARA)翻拍一份份已塵封但被解密有關台灣的歷史檔案,並重現在網站上讓大家「尋寶」,認識歷史。

【延伸閱讀】g0v獎助金獲獎專案(一)|「路況不平」誰相助?5台小黃與公務車找全台道路坑洞

用科技讓海外台灣史料重現國人眼前

「這些史料很需要被台灣人看見,」在紐約居住超過十年的蕭新晟認為,這些典藏在美國的歷史文件對台灣來說非常重要;尤其很多時候台灣人並沒有記錄,縱使有記錄可能也是從國民黨或是中國的角度切入,而美國則又以另一個角度切入,陳述的史實相對客觀。

而這個計劃的運作模式,就是志工定期在美國出團,到美國國家檔案和記錄管理局,利用他們的翻拍APP對準解密文件進行掃描;這些拍好的圖片會自動上傳到線上的資料庫,然後才進行 OCR文字識別分析,分析圖片中檔案的中英文字,還會擷取關鍵字和建檔(indexed)方便日後搜尋。

所有史料數位化後,也開放給所有台灣人自由在網站在「尋寶」。

「國家寶藏」發起人蕭新晟。

解密文件解讀不易成挑戰

跟很多專案一樣,「國家寶藏」也同樣面臨參與度低的問題。專案雖然一開始是希望「打造讓每個公民都可以挖寶的科技工具」,但是檔案遠在美國,所以大多數情況之下都是由志工定期組團到檔案局翻拍。

蕭新晟表示,另外一個難題,就是讀者不容易閱讀這些史料。因為內容都很艱深,除了可能是英文,很多時候檔案內容是以官方英文(offical governmental laugage)撰寫,比較無趣和難懂。所以他們團隊會做一些轉譯,希望可以吸引更多台灣人了解這些屬於台灣的歷史。

兩年內翻拍逾20萬筆史料

雖然困難重重,但蕭新晟亦透露,參與人數至今逾500人,而且在兩年內完成了20萬筆海外台灣史料翻拍。

這些美國解密文件中記錄了包括「台灣關係法」、二二八事件、二戰時期日本戰俘營等等有關台灣的歷史文件;而這些檔案許多是由美國外交部門所撰寫,所以記載著美國在當時的觀點,對台灣來說有非常重要的意義。

「我們從小長大讀的歷史,是由一個外來政權來幫我們編制、寫好的歷史,然後他教我們這就是台灣的歷史,」蕭新晟覺得,在他那一代學習有關台灣的歷史,都只是從教科書上吸收;但是他希望「國家寶藏」,可以讓大家從第一手歷史文件中從根源認識歷史。

他認為這次計劃,使得一些人用更開放的方式來理解台灣的歷史,而不只從教科書或是歷史學家得知歷史。

望到其他國家檔案局挖更多寶

雖然「國家寶藏」在兩年內完成了20萬筆海外台灣史料翻拍,這當然是一個頗驚人的數字,不過蕭新晟也強調,美國檔案局已知還有至少6000萬筆有關台灣的歷史檔案,所以未來「國家寶藏」仍然會持續進行「挖寶」。

「這是一個愚公移山的計劃,」蕭新晟表示,礙於人力不足,加上資金問題,目前「國家寶藏」只能「低度營運」;現在還持續擴展資料庫,並定期出團到美國檔案局翻拍。

他希望,未來可以到其他海外國家的檔案館進行翻拍,諸如英國、日本、荷蘭等對台灣有重大意義的國家。(本文授權條款為以下:g0v 揪松團 CC BY 4.0)


【國家寶藏】
專案成員:蕭新晟 (hsiao-a)、林育正(小風)、莊士杰(Abraham)、張文馨(moon)
專案網頁:https://www.nationaltreasure.tw/

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結