Lĩnh vực AI đang nổi lên, thời đại "trận chiến trăm mô hình" đã đến
Tháng trước, trong giới AI đã bùng nổ một cuộc "cuộc chiến động vật". Một bên là Llama do Meta phát hành, được các nhà phát triển yêu thích nhờ tính năng mã nguồn mở. Bên kia là mô hình lớn có tên là Falcon, sau khi ra mắt vào tháng 5 năm nay đã vượt qua Llama để đứng đầu bảng xếp hạng LLM mã nguồn mở.
Thú vị là, nhà phát triển của Falcon là Viện Nghiên cứu Đổi mới Công nghệ ở Abu Dhabi, thủ đô của Các Tiểu vương quốc Ả Rập Thống nhất. Bộ trưởng Trí tuệ Nhân tạo của Các Tiểu vương quốc Ả Rập Thống nhất sau đó đã được lựa chọn vào danh sách "100 người có ảnh hưởng nhất trong lĩnh vực AI" của tạp chí Time.
Hiện nay, lĩnh vực AI đã bước vào giai đoạn trăm hoa đua nở. Những quốc gia và doanh nghiệp có tài chính nhất định đều đang phát triển phiên bản ChatGPT nội địa. Chỉ riêng ở khu vực Vùng Vịnh, Ả Rập Saudi vừa mới mua hơn 3000 chip H100 cho các trường đại học trong nước để phục vụ việc đào tạo LLM.
Tình huống này khiến người ta không khỏi thắc mắc: cái gọi là công nghệ cứng khó khăn, sao lại biến thành "một quốc gia một mẫu"?
Transformer đã thay đổi quy tắc trò chơi
Năm 2017, tám nhà khoa học máy tính của Google đã công bố thuật toán Transformer trong bài báo "Attention Is All You Need", trở thành chất xúc tác cho cơn sốt AI lần này. Hiện nay, tất cả các mô hình lớn, bao gồm cả series GPT, đều được xây dựng trên nền tảng Transformer.
Cách mạng của Transformer chủ yếu có hai điểm: Một là thay thế thiết kế lặp bằng mã hóa vị trí, thực hiện tính toán song song, nâng cao hiệu suất huấn luyện một cách đáng kể; Hai là tăng cường khả năng hiểu ngữ cảnh.
Điều này biến các mô hình lớn từ nghiên cứu lý thuyết thành vấn đề kỹ thuật. Dữ liệu, quy mô sức mạnh tính toán, kiến trúc mô hình và các yếu tố kỹ thuật khác trở thành chìa khóa trong cuộc đua AI. Chỉ cần có một chút năng lực kỹ thuật, các công ty đều có thể phát triển các mô hình lớn.
Cuộc chiến giữa mã nguồn mở và mã nguồn đóng
Hiện tại, "trận chiến mô hình lớn" đã trở thành hiện thực. Tính đến tháng 7, số lượng mô hình lớn của Trung Quốc đạt 130 cái, vượt qua 114 cái của Mỹ. Các quốc gia khác như Nhật Bản, Ấn Độ, Hàn Quốc cũng đã có mô hình lớn riêng.
Tuy nhiên, vào sân dễ nhưng thành công thì khó. Lấy Falcon làm ví dụ, mặc dù xếp hạng cao hơn Llama, nhưng khó có thể nói rằng nó gây ra ảnh hưởng thực sự đối với Meta. Đối với các mô hình lớn mã nguồn mở, cộng đồng phát triển năng động mới là lợi thế cạnh tranh cốt lõi. Meta đã có truyền thống mã nguồn mở từ lâu, và họ có lợi thế hơn trong việc vận hành cộng đồng.
Tất nhiên, việc nâng cao hiệu suất cũng là một con đường. Nhưng hiện tại, hầu hết các LLM vẫn còn khoảng cách rõ rệt với GPT-4. Trong bài kiểm tra AgentBench mới nhất, GPT-4 dẫn đầu với điểm số 4.41, trong khi người đứng thứ hai là Claude chỉ đạt 2.77 điểm, và các mô hình mã nguồn mở khác thường đạt khoảng 1 điểm.
Nguyên nhân gây ra sự chênh lệch này là đội ngũ các nhà khoa học xuất sắc của OpenAI và kinh nghiệm tích lũy lâu dài. Cốt lõi của mô hình lớn nằm ở việc xây dựng hệ sinh thái ( mã nguồn mở ) hoặc khả năng suy luận thuần túy ( mã nguồn đóng ).
Mất cân bằng giữa chi phí và thu nhập
Hiện tại, ngành mô hình lớn đang gặp vấn đề nghiêm trọng giữa chi phí và doanh thu. Theo ước tính của Sequoia Capital, các công ty công nghệ toàn cầu chi tiêu lên tới 200 tỷ USD mỗi năm cho cơ sở hạ tầng mô hình lớn, trong khi doanh thu hàng năm của mô hình lớn chỉ đạt tối đa 75 tỷ USD, tạo ra khoảng cách ít nhất 125 tỷ USD.
Ngay cả những gã khổng lồ phần mềm như Microsoft và Adobe cũng đang đối mặt với thua lỗ trong các sản phẩm AI. Hầu hết các công ty mô hình lớn sau khi đầu tư khổng lồ vẫn chưa tìm ra mô hình lợi nhuận rõ ràng.
Với sự gia tăng cạnh tranh đồng nhất và sự gia tăng của các mô hình mã nguồn mở, các nhà cung cấp mô hình lớn đơn thuần có thể phải đối mặt với áp lực lớn hơn. Trong tương lai, giá trị của AI có thể sẽ thể hiện nhiều hơn trong các tình huống ứng dụng cụ thể, chứ không phải là bản thân mô hình.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mô hình AI lớn đa dạng nở rộ, ngưỡng kỹ thuật thả khiến cuộc cạnh tranh toàn cầu gia tăng.
Lĩnh vực AI đang nổi lên, thời đại "trận chiến trăm mô hình" đã đến
Tháng trước, trong giới AI đã bùng nổ một cuộc "cuộc chiến động vật". Một bên là Llama do Meta phát hành, được các nhà phát triển yêu thích nhờ tính năng mã nguồn mở. Bên kia là mô hình lớn có tên là Falcon, sau khi ra mắt vào tháng 5 năm nay đã vượt qua Llama để đứng đầu bảng xếp hạng LLM mã nguồn mở.
Thú vị là, nhà phát triển của Falcon là Viện Nghiên cứu Đổi mới Công nghệ ở Abu Dhabi, thủ đô của Các Tiểu vương quốc Ả Rập Thống nhất. Bộ trưởng Trí tuệ Nhân tạo của Các Tiểu vương quốc Ả Rập Thống nhất sau đó đã được lựa chọn vào danh sách "100 người có ảnh hưởng nhất trong lĩnh vực AI" của tạp chí Time.
Hiện nay, lĩnh vực AI đã bước vào giai đoạn trăm hoa đua nở. Những quốc gia và doanh nghiệp có tài chính nhất định đều đang phát triển phiên bản ChatGPT nội địa. Chỉ riêng ở khu vực Vùng Vịnh, Ả Rập Saudi vừa mới mua hơn 3000 chip H100 cho các trường đại học trong nước để phục vụ việc đào tạo LLM.
Tình huống này khiến người ta không khỏi thắc mắc: cái gọi là công nghệ cứng khó khăn, sao lại biến thành "một quốc gia một mẫu"?
Transformer đã thay đổi quy tắc trò chơi
Năm 2017, tám nhà khoa học máy tính của Google đã công bố thuật toán Transformer trong bài báo "Attention Is All You Need", trở thành chất xúc tác cho cơn sốt AI lần này. Hiện nay, tất cả các mô hình lớn, bao gồm cả series GPT, đều được xây dựng trên nền tảng Transformer.
Cách mạng của Transformer chủ yếu có hai điểm: Một là thay thế thiết kế lặp bằng mã hóa vị trí, thực hiện tính toán song song, nâng cao hiệu suất huấn luyện một cách đáng kể; Hai là tăng cường khả năng hiểu ngữ cảnh.
Điều này biến các mô hình lớn từ nghiên cứu lý thuyết thành vấn đề kỹ thuật. Dữ liệu, quy mô sức mạnh tính toán, kiến trúc mô hình và các yếu tố kỹ thuật khác trở thành chìa khóa trong cuộc đua AI. Chỉ cần có một chút năng lực kỹ thuật, các công ty đều có thể phát triển các mô hình lớn.
Cuộc chiến giữa mã nguồn mở và mã nguồn đóng
Hiện tại, "trận chiến mô hình lớn" đã trở thành hiện thực. Tính đến tháng 7, số lượng mô hình lớn của Trung Quốc đạt 130 cái, vượt qua 114 cái của Mỹ. Các quốc gia khác như Nhật Bản, Ấn Độ, Hàn Quốc cũng đã có mô hình lớn riêng.
Tuy nhiên, vào sân dễ nhưng thành công thì khó. Lấy Falcon làm ví dụ, mặc dù xếp hạng cao hơn Llama, nhưng khó có thể nói rằng nó gây ra ảnh hưởng thực sự đối với Meta. Đối với các mô hình lớn mã nguồn mở, cộng đồng phát triển năng động mới là lợi thế cạnh tranh cốt lõi. Meta đã có truyền thống mã nguồn mở từ lâu, và họ có lợi thế hơn trong việc vận hành cộng đồng.
Tất nhiên, việc nâng cao hiệu suất cũng là một con đường. Nhưng hiện tại, hầu hết các LLM vẫn còn khoảng cách rõ rệt với GPT-4. Trong bài kiểm tra AgentBench mới nhất, GPT-4 dẫn đầu với điểm số 4.41, trong khi người đứng thứ hai là Claude chỉ đạt 2.77 điểm, và các mô hình mã nguồn mở khác thường đạt khoảng 1 điểm.
Nguyên nhân gây ra sự chênh lệch này là đội ngũ các nhà khoa học xuất sắc của OpenAI và kinh nghiệm tích lũy lâu dài. Cốt lõi của mô hình lớn nằm ở việc xây dựng hệ sinh thái ( mã nguồn mở ) hoặc khả năng suy luận thuần túy ( mã nguồn đóng ).
Mất cân bằng giữa chi phí và thu nhập
Hiện tại, ngành mô hình lớn đang gặp vấn đề nghiêm trọng giữa chi phí và doanh thu. Theo ước tính của Sequoia Capital, các công ty công nghệ toàn cầu chi tiêu lên tới 200 tỷ USD mỗi năm cho cơ sở hạ tầng mô hình lớn, trong khi doanh thu hàng năm của mô hình lớn chỉ đạt tối đa 75 tỷ USD, tạo ra khoảng cách ít nhất 125 tỷ USD.
Ngay cả những gã khổng lồ phần mềm như Microsoft và Adobe cũng đang đối mặt với thua lỗ trong các sản phẩm AI. Hầu hết các công ty mô hình lớn sau khi đầu tư khổng lồ vẫn chưa tìm ra mô hình lợi nhuận rõ ràng.
Với sự gia tăng cạnh tranh đồng nhất và sự gia tăng của các mô hình mã nguồn mở, các nhà cung cấp mô hình lớn đơn thuần có thể phải đối mặt với áp lực lớn hơn. Trong tương lai, giá trị của AI có thể sẽ thể hiện nhiều hơn trong các tình huống ứng dụng cụ thể, chứ không phải là bản thân mô hình.