使用者資料自主革命：Vana平臺讓AI模型共享所有權

科技 04-04

2024年2月，Reddit與Google簽訂了一筆6,000萬美元的交易，允許這家搜尋巨頭使用平臺資料訓練人工智慧模型。值得注意的是，這些討論完全排除了Reddit使用者——正是他們的資料被當成商品販售。這項交易赤裸裸地展現了現代網際網路的現實：科技巨頭掌控著我們所有的線上資料，並獨斷決定如何處置這些數位資產。

在這樣的背景下，源自MIT課堂專案的去中心化平臺Vana正掀起一場資料自主權革命。該公司建立了一個完全由使用者主導的網路，讓個人能夠上傳資料並掌握使用許可權。AI開發者可以向使用者提案新模型構想，若使用者同意貢獻資料參與訓練，就能獲得相對應的模型所有權份額。

「要打造更好的AI系統，這些資料不可或缺。」Vana共同創辦人Anna Kazlauskas強調：「我們建立的去中心化系統，既能取得目前被科技巨頭壟斷的優質資料，又能讓使用者保留最終控制權。」

Kazlauskas的求學歷程頗具傳奇色彩。這位曾在宿舍房間挖礦以太幣、甚至翻找校園廢棄電腦晶片的MIT校友，原本立志成為經濟學家，卻因2015年加入MIT比特幣社團而踏入區塊鏈世界。她與哈佛畢業的合夥人Art Abal在Media Lab的「Emergent Ventures」課程相遇，共同萌生以創新方式獲取AI訓練資料的想法。

Vana巧妙運用一項鮮為人知的法律條款，允許使用者直接從各大平臺匯出個人資料。這些資料會被加密儲存在Vana的數位錢包中，使用者可自主決定如何分配運用。AI工程師能提案開源模型構想，人們則可以匯集資料參與訓練——在區塊鏈領域，這種資料池被稱為「資料DAO」（去中心化自治組織）。

平臺採用的隱私保護機制確保使用者個資不會外洩。模型建立後，貢獻者能持續獲得與資料貢獻量成比例的收益分成。Kazlauskas舉例說明：「開發者現在能打造高度個人化的健康應用，精確考量你的飲食、睡眠和運動資料，這在當前科技巨頭築起的高牆花園內根本無法實現。」

2023年，有工程師提案利用Vana使用者的Reddit資料訓練發文AI模型，獲得超過14萬人響應。使用者不僅共同決定了模型使用條款，更在模型建成後持續保有所有權。目前Vana已促成多項創新合作，包括整合X平臺資料、Oura手環睡眠資料等，甚至能跨平臺組合Spotify聆聽紀錄、Reddit貼文與時尚偏好等多後設資料，創造出更強大的模型。

現階段Vana已擁有逾百萬使用者和20多個運作中的資料DAO，另有300多個資料池提案正在審核。Kazlauskas指出：「當科技巨頭忙著構築資料護城河時，Vana讓數以萬計的普通人能集體創造連大企業都難以企及的資料價值。這創造了雙贏局面：使用者因擁有模型而受益於AI發展，同時避免出現單一公司壟斷超級AI的危險情境。」