使用者資料自主革命:Vana平臺讓AI模型共享所有權
2024年2月,Reddit與Google簽訂了一筆6,000萬美元的交易,允許這家搜尋巨頭使用平臺資料訓練人工智慧模型。值得注意的是,這些討論完全排除了Reddit使用者——正是他們的資料被當成商品販售。這項交易赤裸裸地展現了現代網際網路的現實:科技巨頭掌控著我們所有的線上資料,並獨斷決定如何處置這些數位資產。
在這樣的背景下,源自MIT課堂專案的去中心化平臺Vana正掀起一場資料自主權革命。該公司建立了一個完全由使用者主導的網路,讓個人能夠上傳資料並掌握使用許可權。AI開發者可以向使用者提案新模型構想,若使用者同意貢獻資料參與訓練,就能獲得相對應的模型所有權份額。
「要打造更好的AI系統,這些資料不可或缺。」Vana共同創辦人Anna Kazlauskas強調:「我們建立的去中心化系統,既能取得目前被科技巨頭壟斷的優質資料,又能讓使用者保留最終控制權。」
Kazlauskas的求學歷程頗具傳奇色彩。這位曾在宿舍房間挖礦以太幣、甚至翻找校園廢棄電腦晶片的MIT校友,原本立志成為經濟學家,卻因2015年加入MIT比特幣社團而踏入區塊鏈世界。她與哈佛畢業的合夥人Art Abal在Media Lab的「Emergent Ventures」課程相遇,共同萌生以創新方式獲取AI訓練資料的想法。
Vana巧妙運用一項鮮為人知的法律條款,允許使用者直接從各大平臺匯出個人資料。這些資料會被加密儲存在Vana的數位錢包中,使用者可自主決定如何分配運用。AI工程師能提案開源模型構想,人們則可以匯集資料參與訓練——在區塊鏈領域,這種資料池被稱為「資料DAO」(去中心化自治組織)。
平臺採用的隱私保護機制確保使用者個資不會外洩。模型建立後,貢獻者能持續獲得與資料貢獻量成比例的收益分成。Kazlauskas舉例說明:「開發者現在能打造高度個人化的健康應用,精確考量你的飲食、睡眠和運動資料,這在當前科技巨頭築起的高牆花園內根本無法實現。」
2023年,有工程師提案利用Vana使用者的Reddit資料訓練發文AI模型,獲得超過14萬人響應。使用者不僅共同決定了模型使用條款,更在模型建成後持續保有所有權。目前Vana已促成多項創新合作,包括整合X平臺資料、Oura手環睡眠資料等,甚至能跨平臺組合Spotify聆聽紀錄、Reddit貼文與時尚偏好等多後設資料,創造出更強大的模型。
現階段Vana已擁有逾百萬使用者和20多個運作中的資料DAO,另有300多個資料池提案正在審核。Kazlauskas指出:「當科技巨頭忙著構築資料護城河時,Vana讓數以萬計的普通人能集體創造連大企業都難以企及的資料價值。這創造了雙贏局面:使用者因擁有模型而受益於AI發展,同時避免出現單一公司壟斷超級AI的危險情境。」