DataFi:AI時代的新機遇 Web3如何引領數據賽道

從AI數據賽道看DataFi的發展潛力

當今世界正處於全球範圍內競相構建最佳基礎模型的時代。雖然計算能力和模型架構很重要,但真正的護城河是訓練數據。本文將從Scale AI談起,探討AI數據賽道的潛力。

Scale AI的成功之道

Scale AI目前估值290億美元,其服務對象包括美國軍方和多家有競爭關係的AI巨頭。Scale AI的核心業務是提供大量準確的標注數據,它之所以能在衆多獨角獸中脫穎而出,是因爲早早發現了數據在AI產業中的重要性。

算力、模型、數據是AI模型的三大支柱。在大語言模型快速發展的過程中,業界的發展重點經歷了從模型到算力的轉移。如今,大多數模型都已確立了transformer作爲模型框架,各大巨頭也通過自建超級計算集羣或與雲服務商籤訂長期協議解決了算力問題。在這種情況下,數據的重要性逐漸凸顯。

Scale AI不僅致力於挖掘現有數據,還將目光投向更長遠的數據生成業務。它通過組建由不同領域人工專家組成的AI訓練團隊,爲AI模型的訓練提供更加優質的訓練數據。

AI模型訓練的兩個階段

AI模型的訓練分爲預訓練和微調兩個部分。

預訓練階段類似於人類嬰兒學習說話的過程。我們需要向AI模型輸入大量從網上爬取的文本、代碼等信息,讓模型通過自我學習掌握基礎的溝通能力。

微調階段則類似於學校教育,有明確的對錯、答案和方向。通過一些事先處理好的、有針對性的數據集,我們可以培養模型具備特定的能力。

因此,AI訓練所需的數據也分爲兩類:

  1. 無需太多處理的大量數據,通常來自大型UGC平台的爬蟲數據、公開文獻數據庫、企業私有數據庫等。

  2. 需要精細設計和篩選的數據,類似專業課本,需要進行數據清洗、篩選、打標籤、人工反饋等工作。

這兩類數據集構成了AI數據賽道的主體。隨着模型能力的進一步提升,各種更加精細、專業的訓練數據將成爲模型能力的關鍵影響因素。

Web3 DataFi:AI數據的理想沃土

相比傳統的數據處理方式,Web3在AI數據領域具有天然優勢,由此誕生了DataFi的新概念。Web3 DataFi的優勢主要體現在以下幾個方面:

  1. 智能合約保障的數據主權、安全和隱私
  2. 分布式架構帶來的地理套利優勢
  3. 區塊鏈明確的激勵和結算優勢
  4. 有利於構建更加高效、開放的"一條龍"數據市場

對於普通用戶而言,DataFi是最容易參與的去中心化AI項目。用戶無需籤訂復雜合同或投入昂貴硬件,只需通過簡單的任務就能參與其中,如提供數據、對模型進行評估、利用AI工具進行簡單創作等。

數據即資產:DataFi 正在開啓新藍海

Web3 DataFi的潛力項目

目前,多個Web3 DataFi項目已獲得大額融資,顯示出這一領域的巨大潛力。以下是一些代表性項目:

  1. Sahara AI:致力於打造去中心化AI的超級基礎設施和交易市場。

  2. Yupp:AI模型的反饋平台,收集用戶對模型輸出內容的反饋。

  3. Vana:將用戶個人數據轉化爲可貨幣化的數字資產。

  4. Chainbase:聚焦鏈上數據,覆蓋200多條區塊鏈。

  5. Sapien:旨在將人類知識大規模轉化爲高質量的AI訓練數據。

  6. Prisma X:致力於成爲機器人的開放協調層,物理數據收集是其關鍵。

  7. Masa:Bittensor生態的頭部子網項目,運營數據子網和Agent子網。

  8. Irys:專注於可編程數據存儲和計算。

  9. ORO:賦能普通人參與AI貢獻。

  10. Gata:定位爲去中心化數據層,提供多種參與方式。

數據即資產:DataFi 正在開啓新藍海

對當前項目的思考

目前這些項目的壁壘普遍不高,但一旦積累了用戶和生態粘性,平台優勢會迅速累積。因此,早期項目應在激勵措施和用戶體驗上着重發力。

同時,這些數據平台還需要考慮如何管理人工、保障數據產出的質量,避免出現劣幣驅逐良幣的現象。一些項目如Sahara和Sapien已開始在數據質量方面加強管理。

此外,提高透明度也是當前鏈上項目面臨的一個重要問題。許多項目仍缺乏足夠的公開、可追蹤的數據,這對Web3 DataFi的長期健康發展是不利的。

最後,DataFi的大規模應用需要同時吸引足夠多的個人參與者和獲得主流企業的認可。一些項目如Sahara AI和Vana在這方面已取得不錯的進展。

DataFi代表了人類智能與機器智能的長期共生關係。對於那些對AI時代充滿期待又擔憂的人來說,參與DataFi不失爲一個順勢而爲的好選擇。

數據即資產:DataFi 正在開啓新藍海

SAHARA4.01%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 分享
留言
0/400
反向指标君vip
· 2小時前
又开始吹DataFi了
回復0
币圈相声社vip
· 2小時前
啊哈,终于开始割AI韭菜了,上次元宇宙,这回又来新故事
回復0
偏执之王vip
· 2小時前
训练数据也能卷起来?
回復0
养老笑看大饼vip
· 2小時前
290亿,割韭菜呢吧...
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)