Trọng tâm mới của ngành AI: Dữ liệu trên chuỗi trở thành chìa khóa để vượt qua rào cản dữ liệu

Điểm nhấn mới trong ngành AI: Giá trị của cơ sở hạ tầng dữ liệu và dữ liệu trên chuỗi

Khi quy mô tham số của mô hình trí tuệ nhân tạo vượt qua hàng nghìn tỷ, khả năng tính toán được đo bằng hàng trăm triệu triệu phép toán mỗi giây, dữ liệu đã trở thành nút thắt quan trọng trong sự phát triển của AI. Cách mạng trong ngành công nghiệp AI trong tương lai sẽ không còn được dẫn dắt bởi kiến trúc mô hình hoặc sức mạnh chip, mà phụ thuộc vào cách biến đổi dữ liệu hành vi con người phân mảnh thành tài nguyên có thể xác minh, có cấu trúc và có thể sử dụng trực tiếp bởi AI. Xu hướng này tiết lộ những mâu thuẫn cấu trúc mà sự phát triển AI hiện nay đang phải đối mặt, đồng thời phác thảo một bức tranh hoàn toàn mới về kỷ nguyên "tài chính hóa dữ liệu", trong đó dữ liệu sẽ trở thành yếu tố sản xuất cốt lõi có thể đo lường, giao dịch và gia tăng giá trị như điện năng và sức mạnh tính toán.

Những khó khăn về dữ liệu trong ngành AI

Sự phát triển của AI từ lâu đã được thúc đẩy bởi "mô hình - sức mạnh tính toán". Kể từ cuộc cách mạng học sâu, số lượng tham số mô hình đã tăng từ hàng triệu lên hàng nghìn tỷ, nhu cầu sức mạnh tính toán tăng trưởng theo cấp số nhân. Theo ước tính, chi phí để đào tạo một mô hình ngôn ngữ lớn tiên tiến đã vượt quá 100 triệu USD, trong đó 90% được sử dụng cho việc thuê cụm GPU. Tuy nhiên, khi ngành công nghiệp tập trung vào "mô hình lớn hơn" và "chip nhanh hơn", một cuộc khủng hoảng bên cung cấp dữ liệu đang âm thầm đến.

"Dữ liệu hữu cơ" do con người tạo ra đã đạt đến giới hạn tăng trưởng. Lấy dữ liệu văn bản làm ví dụ, tổng lượng văn bản chất lượng cao có thể thu thập công khai trên internet khoảng 10^12 từ, trong khi một mô hình với 100 tỷ tham số cần tiêu tốn khoảng 10^13 từ dữ liệu. Điều này có nghĩa là kho dữ liệu hiện có chỉ có thể hỗ trợ việc đào tạo 10 mô hình có quy mô tương đương. Đáng lo ngại hơn, tỷ lệ dữ liệu lặp lại và nội dung chất lượng thấp chiếm hơn 60%, càng làm giảm nguồn cung dữ liệu hiệu quả. Khi các mô hình bắt đầu "nuốt" dữ liệu do chính chúng tạo ra, sự suy giảm hiệu suất của mô hình do "ô nhiễm dữ liệu" đã trở thành mối lo ngại trong ngành.

Nguồn gốc của mâu thuẫn này nằm ở chỗ: Ngành công nghiệp AI lâu nay coi dữ liệu là "tài nguyên miễn phí", chứ không phải là "tài sản chiến lược" cần được nuôi dưỡng cẩn thận. Mô hình và sức mạnh tính toán đã hình thành một hệ thống thị trường trưởng thành, nhưng việc sản xuất, làm sạch, xác minh và giao dịch dữ liệu vẫn ở trong "thời kỳ hoang dã". Mười năm tiếp theo của AI sẽ là mười năm của "cơ sở hạ tầng dữ liệu", và dữ liệu trên chuỗi của mạng mã hóa chính là chìa khóa để giải quyết tình huống này.

Dữ liệu on-chain: Cơ sở dữ liệu "hành vi con người" cần nhất cho AI

Trong bối cảnh thiếu dữ liệu, dữ liệu trên chuỗi của mạng lưới tiền điện tử thể hiện giá trị không thể thay thế. So với dữ liệu trên internet truyền thống, dữ liệu trên chuỗi có tính xác thực của "sự phù hợp động lực" một cách tự nhiên. Mỗi giao dịch, mỗi tương tác hợp đồng, mỗi hành động của địa chỉ ví đều liên kết trực tiếp với vốn thực và không thể thay đổi. Những dữ liệu này có thể được định nghĩa là "dữ liệu hành vi phù hợp động lực của con người tập trung nhất trên internet", cụ thể thể hiện ở ba khía cạnh:

  1. "Tín hiệu ý định" trong thế giới thực: Dữ liệu trên chuỗi ghi lại các hành động quyết định được bỏ phiếu bằng tiền thật, trực tiếp phản ánh đánh giá của người dùng về giá trị dự án, sở thích rủi ro và chiến lược phân bổ vốn. Dữ liệu "được bảo chứng bằng vốn" này có giá trị rất cao cho khả năng ra quyết định của AI.

  2. Chuỗi hành vi có thể truy xuất: Tính minh bạch của blockchain cho phép hành vi của người dùng được truy xuất hoàn toàn. Lịch sử giao dịch của một địa chỉ ví, các giao thức đã tương tác, và sự thay đổi của tài sản nắm giữ, tạo thành một "chuỗi hành vi" liên kết. Dữ liệu hành vi có cấu trúc như vậy chính là "mẫu suy luận con người" hiếm có nhất của các mô hình AI hiện nay.

  3. Hệ sinh thái mở "truy cập không cần giấy phép": Dữ liệu trên chuỗi là công khai và không cần giấy phép. Bất kỳ nhà phát triển nào cũng có thể truy cập dữ liệu gốc thông qua trình duyệt blockchain hoặc API dữ liệu, điều này cung cấp nguồn dữ liệu "không rào cản" cho việc đào tạo mô hình AI.

Tuy nhiên, tính mở của dữ liệu trên chuỗi cũng mang lại thách thức: những dữ liệu này tồn tại dưới dạng "nhật ký sự kiện", là "tín hiệu thô" không có cấu trúc, cần được làm sạch, chuẩn hóa và liên kết để có thể được sử dụng bởi các mô hình AI. Hiện tại, "tỷ lệ chuyển đổi cấu trúc" của dữ liệu trên chuỗi chưa đến 5%, một lượng lớn tín hiệu có giá trị cao bị chôn vùi trong hàng tỷ sự kiện phân mảnh.

"Hệ điều hành" dữ liệu on-chain

Để giải quyết vấn đề phân mảnh dữ liệu trên chuỗi, ngành công nghiệp đã đề xuất một khái niệm "hệ điều hành thông minh trên chuỗi" được thiết kế đặc biệt cho AI. Mục tiêu cốt lõi của nó là chuyển đổi các tín hiệu phân tán trên chuỗi thành dữ liệu AI-ready có cấu trúc, có thể xác minh và có thể kết hợp theo thời gian thực. Hệ thống này bao gồm các thành phần chính sau:

  1. Tiêu chuẩn dữ liệu mở: Đồng nhất định nghĩa và cách mô tả dữ liệu trên chuỗi, đảm bảo rằng mô hình AI không cần thích ứng với định dạng dữ liệu của các chuỗi hoặc giao thức khác, mà có thể "hiểu" trực tiếp logic kinh doanh phía sau dữ liệu.

  2. Cơ chế xác thực dữ liệu: Đảm bảo tính xác thực của dữ liệu thông qua cơ chế đồng thuận của blockchain. Khi hệ thống xử lý một sự kiện trên chuỗi, các nút xác thực sẽ kiểm tra chéo giá trị băm của dữ liệu, thông tin chữ ký và trạng thái trên chuỗi, đảm bảo rằng dữ liệu cấu trúc đầu ra hoàn toàn khớp với dữ liệu gốc trên chuỗi.

  3. Lớp khả năng truy cập dữ liệu với throughput cao: Thông qua việc tối ưu hóa thuật toán nén dữ liệu và giao thức truyền tải, đạt được việc xử lý hàng trăm ngàn sự kiện trên chuỗi trong thời gian thực mỗi giây. Thiết kế này cho phép hệ thống đáp ứng nhu cầu dữ liệu thời gian thực cho các ứng dụng AI quy mô lớn.

Tầm nhìn trong thời đại "Tài chính dữ liệu"

Mục tiêu cuối cùng của hệ điều hành dữ liệu trên chuỗi này là thúc đẩy ngành AI bước vào kỷ nguyên "tài chính hóa dữ liệu" — dữ liệu không còn là "nguyên liệu huấn luyện" thụ động, mà là "vốn" chủ động, có thể được định giá, giao dịch và gia tăng giá trị. Việc hiện thực hóa tầm nhìn này phụ thuộc vào việc chuyển đổi dữ liệu thành bốn thuộc tính cốt lõi:

  1. Cấu trúc: Chuyển đổi dữ liệu chuỗi gốc thành dữ liệu có cấu trúc có thể được mô hình AI gọi trực tiếp.

  2. Có thể kết hợp: Dữ liệu có cấu trúc có thể kết hợp tự do như các khối Lego, mở rộng ranh giới ứng dụng của dữ liệu.

  3. Có thể xác minh: Đảm bảo tính xác thực và khả năng truy nguyên của dữ liệu thông qua công nghệ blockchain.

  4. Có thể biến thành tiền: Người cung cấp dữ liệu có thể biến dữ liệu có cấu trúc thành tiền trực tiếp, giá trị của dữ liệu được quyết định bởi cung và cầu của thị trường.

Trong kỷ nguyên mới này, dữ liệu sẽ trở thành cầu nối giữa AI và thế giới thực. Các đại lý giao dịch có thể cảm nhận tâm lý thị trường thông qua dữ liệu on-chain, các ứng dụng tự chủ có thể tối ưu hóa dịch vụ thông qua dữ liệu hành vi người dùng, trong khi người dùng thông thường có thể thu được lợi ích liên tục thông qua việc chia sẻ dữ liệu.

Khi chúng ta nói về tương lai của AI, không nên chỉ tập trung vào "mức độ thông minh" của mô hình, mà còn phải chú ý đến "mảnh đất dữ liệu" hỗ trợ sự thông minh đó. Sự tiến hóa của AI, bản chất là sự tiến hóa của cơ sở hạ tầng dữ liệu. Từ "hạn chế" trong việc con người tạo ra dữ liệu đến "khám phá giá trị" của dữ liệu trên chuỗi, từ sự "hỗn loạn" của tín hiệu phân mảnh đến "trật tự" của dữ liệu có cấu trúc, từ "tài nguyên miễn phí" của dữ liệu đến "tài sản vốn" của "tài chính dữ liệu", những biến đổi này đang tái định hình logic nền tảng của ngành công nghiệp AI.

Cũng như mạng điện đã thúc đẩy cuộc cách mạng công nghiệp, mạng tính toán đã thúc đẩy cuộc cách mạng internet, mạng dữ liệu đang thúc đẩy "cuộc cách mạng dữ liệu" của AI. Các ứng dụng AI thế hệ tiếp theo không chỉ cần mô hình hoặc ví, mà còn cần dữ liệu không cần tin tưởng, có thể lập trình và có tín hiệu cao. Khi dữ liệu cuối cùng được trao giá trị xứng đáng, AI mới có thể thực sự giải phóng sức mạnh thay đổi thế giới.

READY-0.93%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
AirdropDreamBreakervip
· 16giờ trước
Dữ liệu biến thành tiền là gì, đồ ngốc gọi là mới.
Xem bản gốcTrả lời0
MevWhisperervip
· 16giờ trước
Dữ liệu on-chain thực sự đang được quan tâm một chút gần đây.
Xem bản gốcTrả lời0
ZkProofPuddingvip
· 17giờ trước
Sao lại cảm thấy như đang thổi phồng một khái niệm vậy nhỉ, hehe
Xem bản gốcTrả lời0
ForkThisDAOvip
· 17giờ trước
Vậy là vẫn phải giao dịch dữ liệu thôi.
Xem bản gốcTrả lời0
AlwaysMissingTopsvip
· 17giờ trước
Dữ liệu mới thực sự là dầu mỏ mới.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)