Modelos de IA florescem em grande número, a Gota nas barreiras tecnológicas provoca competição global

O campo da IA está repleto de concorrência, a era da "Batalha dos Cem Modelos" chegou

No mês passado, houve uma "guerra animal" no mundo da IA. De um lado está o Llama, lançado pela Meta, que é muito apreciado pelos desenvolvedores devido à sua natureza de código aberto. Do outro lado está o grande modelo chamado Falcon, que superou o Llama e alcançou o topo do ranking de LLMs de código aberto desde o seu lançamento em maio deste ano.

Curiosamente, os desenvolvedores do Falcon são do Instituto de Pesquisa em Inovação Tecnológica da capital dos Emirados Árabes Unidos, Abu Dhabi. O Ministro da Inteligência Artificial dos Emirados Árabes Unidos foi posteriormente selecionado para a lista das "100 pessoas mais influentes na área da IA" da revista Time.

Hoje, o campo da IA entrou numa fase de intensa concorrência. Países e empresas com recursos financeiros estão a desenvolver versões locais do ChatGPT. Apenas na região do Golfo, a Arábia Saudita acaba de adquirir mais de 3000 chips H100 para universidades nacionais, destinados ao treino de LLM.

Esta situação leva a questionar: como é que a alta tecnologia difícil prometida se transformou em "um país, um modelo"?

O Transformer mudou as regras do jogo

Em 2017, oito cientistas da computação do Google publicaram o algoritmo Transformer no artigo "Attention Is All You Need", tornando-se o catalisador desta onda de entusiasmo pela IA. Hoje, todos os grandes modelos, incluindo a série GPT, estão baseados na fundação do Transformer.

As transformações do Transformer consistem principalmente em dois pontos: primeiro, a substituição do design recorrente por codificação de posição, permitindo o cálculo paralelo e aumentando significativamente a eficiência do treinamento; segundo, reforçando ainda mais a capacidade de compreensão do contexto.

Isto transformou os grandes modelos de uma questão de pesquisa teórica para um problema de engenharia. Dados, escala de computação, arquitetura de modelos e outros fatores de engenharia tornaram-se a chave da competição em IA. Qualquer empresa com um certo nível de capacidade técnica pode desenvolver grandes modelos.

A disputa entre código aberto e código fechado

Atualmente, a "Guerra dos Modelos" tornou-se uma realidade. Até julho, a China tinha 130 modelos grandes, superando os 114 dos Estados Unidos. Outros países como Japão, Índia e Coreia do Sul também já têm os seus próprios modelos grandes.

No entanto, entrar é fácil, mas ter sucesso é difícil. Tomando o Falcon como exemplo, embora esteja classificado acima do Llama, é difícil afirmar que causa um impacto substancial na Meta. Para grandes modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta já tem uma tradição de código aberto e é melhor na operação da comunidade.

Claro, melhorar o desempenho também é um caminho. Mas atualmente, a maioria dos LLMs ainda tem uma diferença significativa em relação ao GPT-4. No mais recente teste AgentBench, o GPT-4 liderou com 4,41 pontos, enquanto o segundo lugar, Claude, obteve apenas 2,77 pontos, e outros modelos de código aberto ficaram em torno de 1 ponto.

A causa dessa diferença é a excelente equipe de cientistas da OpenAI e a experiência acumulada ao longo do tempo. O núcleo dos grandes modelos está na construção do ecossistema ( código aberto ) ou pura capacidade de raciocínio ( código fechado ).

Desequilíbrio entre Custos e Receitas

Atualmente, a indústria de grandes modelos enfrenta um problema generalizado de grave desbalanceamento entre custos e receitas. Segundo a Sequoia Capital, as empresas de tecnologia em todo o mundo podem gastar até 200 bilhões de dólares anualmente em infraestrutura de grandes modelos, enquanto a receita anual dos grandes modelos é de no máximo 75 bilhões de dólares, existindo uma lacuna de pelo menos 125 bilhões de dólares.

Mesmo gigantes de software como a Microsoft e a Adobe enfrentam perdas em produtos de IA. A maioria das empresas de grandes modelos, após enormes investimentos, ainda não encontrou um modelo de lucro claro.

Com o aumento da concorrência homogeneizada e o número crescente de modelos de código aberto, os fornecedores de grandes modelos podem enfrentar uma pressão maior. No futuro, o valor da IA pode estar mais centrado em cenários de aplicação específicos, em vez do próprio modelo.

GPT-5.73%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Partilhar
Comentar
0/400
0xSherlockvip
· 22h atrás
Mais encantador que dinheiro
Ver originalResponder0
WhaleMinionvip
· 23h atrás
A grande batalha apenas começou
Ver originalResponder0
SignatureDeniedvip
· 08-06 17:05
A tecnologia não tem fronteiras
Ver originalResponder0
LuckyBearDrawervip
· 08-06 17:03
O dinheiro pode resolver tudo.
Ver originalResponder0
SelfStakingvip
· 08-06 16:59
Negociação de criptomoedas não é tão boa quanto modelar.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)