後數位政府時代,台灣關鍵戰場在民間|數位主權新戰國時代(下)

後數位政府時代,台灣關鍵戰場在民間|數位主權新戰國時代(下)
在邁向數位政府的路上,台灣除了開放政府,也應與民間合作、加強建設。圖片來源:Shutterstock
2025-05-13
文・呂佳霖(DSET海外研究員)
7327
在國際上,開放政府與資料運用已成為全球趨勢。

為跟上國際腳步,我國自1996年起開始推動電子化政府的建置。

2018年,為促進政府資料的標準化與應用,政府透過資料標準的制定與推廣,將資料轉化為更具價值的資源,以達廣泛應用至社會各層面,故進一步建置「政府資料標準平台」,以集中管理各領域資料標準,促進資料流通與跨域整合,期望能使資料更易理解、分析與應用,創造新的發展機會。平台現由數位發展部負責持續管理與維護中。

2019年六月,政府確立朝向智慧政府目標邁進,行政院核定「智慧政府行動方案」,逐步開放各部會及地方政府之資料集,並於2020年建置「數位服務個人化(MyData)平台」,該平台賦予民眾個人資料的可攜性,透過一次性身分驗證,可即時從平台取得存在於政府單位的個人資料,舉凡戶政、所得資料、出入境資料、兵役、勞健保、稅務資料等,並可提供其它政府機關或信賴的企業使用,實現政府一站式數位服務。

2020年時,政府效仿愛沙尼亞的X-Road建置了「跨機關資料傳輸專屬通道(T-Road)」,旨在打造一個安全、可靠的政府資料交換平台。T-Road如同政府專用的資料高速公路,讓各機關能即時、安全地傳輸線上服務所需各式的跨機關資訊,不受外部侵害或洩露。對於民眾而言,只需在一個平台上更新個人資訊(例如搬家後之住址異動),系統就會自動將資訊同步到各相關機關,例如戶政、健保、監理等,省去奔波之苦。(延伸閱讀|除了結婚、離婚、買房,在愛沙尼亞,一輩子都不用跑政府

T-Road除可確保安全,也能統一傳輸標準,可以使機關間即時瞭解其他機關釋出的新資料,利於跨機關間資料的流通與多元應用。機關透過授權控管,也能在實現資料安全的同時,符合資料使用原則。

台灣-資料治理-數據交易所-智慧政府-MyData-T-Road-數位皮夾-個資保護-CBPR-資料治理平台T-Road串連政府機關,並安全流通資料,實現數位化智慧政府的願景。圖片來源:T-Road網站

台灣資料治理著重開放政府,民間資料建設待加強

依據數位發展部的規劃,預計2024年底前,47個具有跨機關資料傳輸需求的資安A級機關將全部完成導入,大幅提升政府跨機關資料傳輸的安全與效率。最近規劃中的新政策部分,隨著數位時代來臨,數位識別技術從集中式、聯邦式逐步邁向分散式。

數位發展部為因應全球數位身分自主管理及應用趨勢,於2024年推動「數位皮夾」計畫,民眾可將各種數位證件(如健保卡、自然人憑證等)整合至一個安全且便攜的平台,並自主選擇在不同情境下分享哪些資訊(即最小身分資料揭露原則),避免曝露過多其他個人隱私資料。未來數位皮夾開放原始碼後,民間企業也能將其發行的卡片加入數位皮夾,成為公共程式之一。

台灣-資料治理-智慧政府-MyData-T-Road-數位皮夾-個資保護-CBPR-資料治理-資安數發部推動數位皮夾,讓民眾選擇性揭露資料,掌握隱私安全。圖片來源:數位發展部

另一方面,鑑於資料治理的重要性,日本與韓國均已陸續設置個資保護獨立監督機關;在反映個人資料保護法修法內容下,我國個人資料保護委員會籌備處亦於2023年揭牌,推動建置個人資料保護委員會的法制主管機關,以完足憲法第22條對人民「資訊隱私權」的保障,並奠定國家數位貿易發展的重要基礎。

國際合作方面,我國於2018年獲准成為「跨境隱私規則(Cross-Border Privacy Rules, CBPR)體系會員。APEC CBPR體系為美國領導下在APEC推動的國際隱私法遵標準,盼透過參與該體系,提升消費者對跨境資料傳輸的信賴,形塑有利推動區域內數位貿易發展的條件。2021年六月,財團法人資訊工業策進會成為CBPR的當責機構,協助認證台灣業者的個人資訊保護資格。

從我國既有的資料治理政策可觀察到,政府在資料治理政策的重點,多集中於政府資料的整合與開放,例如開放資料平台的建立、政府內部跨部門數據的共享與協作等方面。

這些措施,為公部門資料的公開取用和基礎建設提供了重要支持,但在促進民間資料集的建立、推動資料多元化應用,以及激勵民間或研究機構參與數據利用的政策層面,相對而言顯得不足。

這種不足,導致我國現有的本土高品質數據仍然不足,尤其是在一些需要結合在地文化、語言特性與產業需求的應用場景,現有資料的覆蓋範圍與細緻度難以滿足需求。

以台灣繁體中文為例,作為一種低資源語言(low-resource language),其相關的數據資源無論在數量上還是質,至今都仍面臨嚴峻的挑戰。

建構本地高品質的資料是關鍵

AI模型建立在高品質的訓練資料上,若用將AI基礎模型比喻為漢堡,資料比喻為食材,無論烹飪技巧多麼專業,若是由發黴的乳酪、惡臭的肉和腐爛的麵包材料製成,註定會做出令人作嘔的漢堡;用低品質資料訓練的AI模型,必然伴隨者低品質的輸出。

此外,有問題的訓練資料,可能會導致AI產生社會無法接納的行為模式;研究顯示,產出有害內容的機率恐大幅提升。然而,為低資源語言尋找到足夠的高品質訓練資料,並非易事。

若單從大型語言模型來看,將中文視為單一語言進行訓練,很可能產生誤導性結果。即使是簡體中文,在中國、新加坡、馬來西亞等地使用的簡體中文,都存有使用差異;此種差異,在使用繁體中文的如台灣、香港、澳門等亦同。

因此,若僅以簡體中文的資料集,或由香港、澳門等地的繁體中文資料集進行訓練,都將影響大型語言模型的產出品質。

因此最理想的,仍是在本地建構足夠高品質的語言資料集,以利在ChatGPT、Gemini等國際大型語言模型上微調(fine-tuning),或訓練如TAIDE等自有的大型語言模型。

然而,需要高品質數據來協助訓練AI模型的,並非僅有大型語言模型。除了設法建立更多高品質語言數據集,若擬強化資料主權以促進AI發展,國家仍需建立健全的機制,以設法在商業市場、科學研究方面,甚至是非屬個人資料(non-personal data)的如工業設備、天氣數據等方面均取得高品質數據集。

當本地產出的高品質數據集愈多,愈能降低對於他國數據的倚賴;藉此訓練的AI模型,在各領域應用時,始能產出較符合本地需求的表現結果。

政策方向:設立數據交易所

因此,如何有效促進建立更多符合本土需求的資料庫,應是資料治理與政策規劃的首要議題。

政府是國內持有最大宗本土資料的單位,其有效釋出資料以供民間使用的重要性,自不待言。然而,民間若能建構有效的數據交易機制,不僅有助於產生更多高品質的數據,亦能促進數據產業生態圈發展。

我國尚未建立集中式的數據交易市場,仍處於由民間自行撮合、尋找交易對象的初始階段。然而觀察各國經驗,設立數據交易所早已非新穎概念,中國、韓國、日本、新加坡等鄰近國家,均已設有集中式數據交易機構。

台灣-資料治理-數據交易所-CBPR-資料治理-數位貿易-繁體中文-資料主權-資安民間數據交易所可提升數據買賣效率,也強化資訊流通性與利用性。圖片來源:Shutterstock

雖各國數據交易所的具體機制與標的略有差異,整體而言,其運作主要依賴數據供應方、數據需求方與交易平台三方的協作,優點為得確保數據交易的安全性、合法性與有效性。

數據供應方通常為擁有大量數據的企業、機構或個人,將數據資產化並在交易所掛牌出售;數據需求方則為需要特定數據的企業或機構,期盼透過交易所瀏覽、購買或訂閱所需的數據集

數據交易所作為中介平台,負責數據的登記、驗證、展示、交易撮合、交付、清結算、憑證發放等。部分數據交易所已逐漸從單純的仲介服務,發展成引入第三方專業服務商,提供資料合規審查、品質評估、價值評估等專業服務,逐步參與數據交易全週期,進一步強化交易所的制度功能與市場信任。

倘若數據交易所制度運作得當,將帶來多重效益。

首先,可有效提升資料的再利用價值,使原本沉澱於各組織內的數據得以活化、創造更高經濟價值。其次,透過標準化的交易流程與契約機制,有助於推動資料格式一致化,提升資料互通性,加速資料流通與應用。

此外,數據交易平台亦能降低資訊不對稱,增進資料供需雙方信任,促進健康有序的數據市場發展。

在法律與政策層面,政府應扮演引導角色,藉由推動數據交易所的設立,建立適當的監理架構,以確保數據交易的透明性與合規性。例如透過隱私保護機制、防範數據壟斷、確保數據流通安全等措施,來平衡數據開放與個資保護之間的關係。

同時,政府亦可透過公私協力,鼓勵企業與研究機構參與數據交易生態圈,共同促進創新應用與數據驅動的產業發展。

綜上所述,數據交易所的設立不僅能提升數據市場的運作效率,更可為資料產業創造更健康的永續發展環境。

透過政府政策引導、民間機構參與及市場機制完善,若能順勢發展出符合本土需求的數據交易機制,將有助於數據經濟的蓬勃發展、加速智慧科技應用的推進,進一步強化國家在資料主權上的競爭力。(延伸閱讀|數位與永續如何並行?郭耀煌:台灣應先掌握六大關鍵方針

延伸閱讀:數位主權新戰國時代系列

其他人也在看

你可能有興趣

已成功複製連結