閱讀重點
- 資料主權概念與演變:資料主權從國際法領域發展,意指資料應受來源國法律或所屬群體治理控制。不僅涵蓋國家層級,原住民族等群體也主張對自身文化資料的集體控制權。
- AI時代的文化掠奪危機:生成式AI大量擷取原住民族藝術、語言等文化內容作為訓練素材,造成「數位化文化掠奪」。社群成為資源輸出者卻無參與治理權,凸顯資料主權急迫性。
- 資料即權力的多元影響:資料主權延伸至醫療、智慧城市、語言復振等領域。誰控制AI、擁有資料、決定訓練內容,直接影響文化記憶保存與群體參與權力。
然而,資料從哪裡來?誰能決定資料可以如何使用?這些問題,正構成當前數位治理領域關鍵的討論之一:「資料主權」(Data Sovereignty)。
源於國際法與隱私法領域,「資料主權」意指資料應受其來源國法律或所屬群體的治理與控制。
例如,歐盟的《一般資料保護規則》(GDPR)便主張個人有權知悉、限制甚至刪除自己的資料使用方式;而後這樣的概念形成一種普遍的基礎,舉例來說,加拿大於2023年提出的《人工智慧與資料法案》(Artificial Intelligence and Data Act, AIDA),即便不是直接使用「資料主權」一詞,但仍反映出國家在跨國資料流通中保有法定主權與道德規範。
但資料主權不僅是國家層級的概念,在當今多元文化的社會中,愈來愈多群體開始主張對自身資料的集體控制權。
例如,南半球的紐西蘭毛利社群倡議「Te Mana Raraunga」憲章(Charter),強調族群在語言、健康、土地等資料的主體性;北半球的美國原住民族資訊治理組織(US Indigenous Data Sovereignty Network)則揭示,資料關乎文化延續與集體決策,並非僅屬於個人私有資產。
這些觀點,對於非原住民族(non-Indigenous)所理解的「擁有」概念,提出了更不一樣的詮釋。
當務之急:資料主權既重要且急迫
AI時代,使得資料主權問題更為複雜。
具體來說,大型語言模型如ChatGPT與圖像生成模型,往往訓練自龐大的開放資料庫,其中不乏新聞文本、社群貼文、學術論文、口述歷史等文化性內容。有些內容經過授權,也有許多未經同意便被蒐集再製。
加拿大原住民族科技公司Animikii曾在2023年發表文章〈The Generative AI Art Heist & Indigenous Dispossession〉,指出當前生成式AI平台在未經授權的情況下,大量擷取原住民族藝術品、語言資料與文化敘事風格,做為訓練模型的素材。此舉不僅侵害創作者的智慧財產權,更造成一波嚴重的「數位化的文化掠奪」(digital dispossession)。
生成式AI只要輸入指令便可進行圖片生成,然而素材取用大多未經授權,造成無形的文化掠奪。圖片來源:截自ChatGPT
該文指出,這波AI浪潮彷彿是一場大規模的資料搶奪行動,原住民族社群在不知情的情況下,成為語言、圖像與知識資源的輸出者,卻無從參與治理,也無法獲得實質回饋。
這樣的情況,即訴說著資料主權的重要性與急迫性:
這已經不僅是保護個資,更關乎集體文化記憶的保存權、知識詮釋權與科技參與權!
如果你跟我不一樣,並非來自台灣的原住民族社群,看到這裡可能會覺得「反正這是原住民的事」,好像離你很遠。但端傳媒的報導〈從創傷到承傳,移加港人與加拿大原住民的生命對照〉,在Threads上的圖卡引用香港鄒崇銘博士的一段話:
「中國對香港的新殖民主義,在某程度上正朝著文化清洗的方向發展。香港人的處境,跟這邊的原住民也是相通的。」
任何社群都有屬於自己的文化表現、語言和知識。現在,你身分認同的文化可能還是「主流」,所以不感威脅,但難保有一天會變成「非主流」——這時候你就知道了。
當AI開始主導決策,而那個AI又掌握在誰的手中?誰擁有資料?誰決定資料訓練內容與價值觀?
這些問題在在都已成為科技治理的核心,資料不只是原料,更是權力的延伸。
當然,「資料主權」除了對於原住民族是當務之急,也延伸到其他領域,例如醫療與生技產業。
當基因資料與健康紀錄被大量用於AI診斷與藥物研發時,卻未必尊重病患或原生社群的知情權與決策權;在智慧城市與移民治理方面,監控系統與城市規劃仰賴即時資料流,但社會邊緣群體往往淪為被監視對象,卻無參與治理的機會。
AI醫療需運用患者基因資料與健康數據,涉及隱私權爭議,且診斷過程未必取得病患知情同意權。圖片來源:Shutterstock
此外,關於語言復振與數位主權,這是任何語言社群都面臨的議題。讀者可以自問:「你會說你阿嬤阿公的語言嗎?說得流暢嗎?」若AI語言模型未與實際的語言使用者或社群合作,反而可能加速語言的邊緣化或誤用。
最後,在全球平台跨法域壟斷的情況下,大型科技公司以境外伺服器處理本地用戶資料,形成治理上的困難。
資料主權不只關乎法律治理與產業利益,更關乎文化記憶、群體主體性與未來參與的權力。AI時代,誰能決定資料如何被看見與詮釋?這不只是技術層次的問題,更是我們如何理解民主、治理與社群關係的當代命題。




