O campo da IA está repleto de concorrência, a era da "Batalha dos Cem Modelos" chegou
No mês passado, houve uma "guerra animal" no mundo da IA. De um lado está o Llama, lançado pela Meta, que é muito apreciado pelos desenvolvedores devido à sua natureza de código aberto. Do outro lado está o grande modelo chamado Falcon, que superou o Llama e alcançou o topo do ranking de LLMs de código aberto desde o seu lançamento em maio deste ano.
Curiosamente, os desenvolvedores do Falcon são do Instituto de Pesquisa em Inovação Tecnológica da capital dos Emirados Árabes Unidos, Abu Dhabi. O Ministro da Inteligência Artificial dos Emirados Árabes Unidos foi posteriormente selecionado para a lista das "100 pessoas mais influentes na área da IA" da revista Time.
Hoje, o campo da IA entrou numa fase de intensa concorrência. Países e empresas com recursos financeiros estão a desenvolver versões locais do ChatGPT. Apenas na região do Golfo, a Arábia Saudita acaba de adquirir mais de 3000 chips H100 para universidades nacionais, destinados ao treino de LLM.
Esta situação leva a questionar: como é que a alta tecnologia difícil prometida se transformou em "um país, um modelo"?
O Transformer mudou as regras do jogo
Em 2017, oito cientistas da computação do Google publicaram o algoritmo Transformer no artigo "Attention Is All You Need", tornando-se o catalisador desta onda de entusiasmo pela IA. Hoje, todos os grandes modelos, incluindo a série GPT, estão baseados na fundação do Transformer.
As transformações do Transformer consistem principalmente em dois pontos: primeiro, a substituição do design recorrente por codificação de posição, permitindo o cálculo paralelo e aumentando significativamente a eficiência do treinamento; segundo, reforçando ainda mais a capacidade de compreensão do contexto.
Isto transformou os grandes modelos de uma questão de pesquisa teórica para um problema de engenharia. Dados, escala de computação, arquitetura de modelos e outros fatores de engenharia tornaram-se a chave da competição em IA. Qualquer empresa com um certo nível de capacidade técnica pode desenvolver grandes modelos.
A disputa entre código aberto e código fechado
Atualmente, a "Guerra dos Modelos" tornou-se uma realidade. Até julho, a China tinha 130 modelos grandes, superando os 114 dos Estados Unidos. Outros países como Japão, Índia e Coreia do Sul também já têm os seus próprios modelos grandes.
No entanto, entrar é fácil, mas ter sucesso é difícil. Tomando o Falcon como exemplo, embora esteja classificado acima do Llama, é difícil afirmar que causa um impacto substancial na Meta. Para grandes modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta já tem uma tradição de código aberto e é melhor na operação da comunidade.
Claro, melhorar o desempenho também é um caminho. Mas atualmente, a maioria dos LLMs ainda tem uma diferença significativa em relação ao GPT-4. No mais recente teste AgentBench, o GPT-4 liderou com 4,41 pontos, enquanto o segundo lugar, Claude, obteve apenas 2,77 pontos, e outros modelos de código aberto ficaram em torno de 1 ponto.
A causa dessa diferença é a excelente equipe de cientistas da OpenAI e a experiência acumulada ao longo do tempo. O núcleo dos grandes modelos está na construção do ecossistema ( código aberto ) ou pura capacidade de raciocínio ( código fechado ).
Desequilíbrio entre Custos e Receitas
Atualmente, a indústria de grandes modelos enfrenta um problema generalizado de grave desbalanceamento entre custos e receitas. Segundo a Sequoia Capital, as empresas de tecnologia em todo o mundo podem gastar até 200 bilhões de dólares anualmente em infraestrutura de grandes modelos, enquanto a receita anual dos grandes modelos é de no máximo 75 bilhões de dólares, existindo uma lacuna de pelo menos 125 bilhões de dólares.
Mesmo gigantes de software como a Microsoft e a Adobe enfrentam perdas em produtos de IA. A maioria das empresas de grandes modelos, após enormes investimentos, ainda não encontrou um modelo de lucro claro.
Com o aumento da concorrência homogeneizada e o número crescente de modelos de código aberto, os fornecedores de grandes modelos podem enfrentar uma pressão maior. No futuro, o valor da IA pode estar mais centrado em cenários de aplicação específicos, em vez do próprio modelo.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
18 gostos
Recompensa
18
5
Partilhar
Comentar
0/400
0xSherlock
· 22h atrás
Mais encantador que dinheiro
Ver originalResponder0
WhaleMinion
· 23h atrás
A grande batalha apenas começou
Ver originalResponder0
SignatureDenied
· 08-06 17:05
A tecnologia não tem fronteiras
Ver originalResponder0
LuckyBearDrawer
· 08-06 17:03
O dinheiro pode resolver tudo.
Ver originalResponder0
SelfStaking
· 08-06 16:59
Negociação de criptomoedas não é tão boa quanto modelar.
Modelos de IA florescem em grande número, a Gota nas barreiras tecnológicas provoca competição global
O campo da IA está repleto de concorrência, a era da "Batalha dos Cem Modelos" chegou
No mês passado, houve uma "guerra animal" no mundo da IA. De um lado está o Llama, lançado pela Meta, que é muito apreciado pelos desenvolvedores devido à sua natureza de código aberto. Do outro lado está o grande modelo chamado Falcon, que superou o Llama e alcançou o topo do ranking de LLMs de código aberto desde o seu lançamento em maio deste ano.
Curiosamente, os desenvolvedores do Falcon são do Instituto de Pesquisa em Inovação Tecnológica da capital dos Emirados Árabes Unidos, Abu Dhabi. O Ministro da Inteligência Artificial dos Emirados Árabes Unidos foi posteriormente selecionado para a lista das "100 pessoas mais influentes na área da IA" da revista Time.
Hoje, o campo da IA entrou numa fase de intensa concorrência. Países e empresas com recursos financeiros estão a desenvolver versões locais do ChatGPT. Apenas na região do Golfo, a Arábia Saudita acaba de adquirir mais de 3000 chips H100 para universidades nacionais, destinados ao treino de LLM.
Esta situação leva a questionar: como é que a alta tecnologia difícil prometida se transformou em "um país, um modelo"?
O Transformer mudou as regras do jogo
Em 2017, oito cientistas da computação do Google publicaram o algoritmo Transformer no artigo "Attention Is All You Need", tornando-se o catalisador desta onda de entusiasmo pela IA. Hoje, todos os grandes modelos, incluindo a série GPT, estão baseados na fundação do Transformer.
As transformações do Transformer consistem principalmente em dois pontos: primeiro, a substituição do design recorrente por codificação de posição, permitindo o cálculo paralelo e aumentando significativamente a eficiência do treinamento; segundo, reforçando ainda mais a capacidade de compreensão do contexto.
Isto transformou os grandes modelos de uma questão de pesquisa teórica para um problema de engenharia. Dados, escala de computação, arquitetura de modelos e outros fatores de engenharia tornaram-se a chave da competição em IA. Qualquer empresa com um certo nível de capacidade técnica pode desenvolver grandes modelos.
A disputa entre código aberto e código fechado
Atualmente, a "Guerra dos Modelos" tornou-se uma realidade. Até julho, a China tinha 130 modelos grandes, superando os 114 dos Estados Unidos. Outros países como Japão, Índia e Coreia do Sul também já têm os seus próprios modelos grandes.
No entanto, entrar é fácil, mas ter sucesso é difícil. Tomando o Falcon como exemplo, embora esteja classificado acima do Llama, é difícil afirmar que causa um impacto substancial na Meta. Para grandes modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta já tem uma tradição de código aberto e é melhor na operação da comunidade.
Claro, melhorar o desempenho também é um caminho. Mas atualmente, a maioria dos LLMs ainda tem uma diferença significativa em relação ao GPT-4. No mais recente teste AgentBench, o GPT-4 liderou com 4,41 pontos, enquanto o segundo lugar, Claude, obteve apenas 2,77 pontos, e outros modelos de código aberto ficaram em torno de 1 ponto.
A causa dessa diferença é a excelente equipe de cientistas da OpenAI e a experiência acumulada ao longo do tempo. O núcleo dos grandes modelos está na construção do ecossistema ( código aberto ) ou pura capacidade de raciocínio ( código fechado ).
Desequilíbrio entre Custos e Receitas
Atualmente, a indústria de grandes modelos enfrenta um problema generalizado de grave desbalanceamento entre custos e receitas. Segundo a Sequoia Capital, as empresas de tecnologia em todo o mundo podem gastar até 200 bilhões de dólares anualmente em infraestrutura de grandes modelos, enquanto a receita anual dos grandes modelos é de no máximo 75 bilhões de dólares, existindo uma lacuna de pelo menos 125 bilhões de dólares.
Mesmo gigantes de software como a Microsoft e a Adobe enfrentam perdas em produtos de IA. A maioria das empresas de grandes modelos, após enormes investimentos, ainda não encontrou um modelo de lucro claro.
Com o aumento da concorrência homogeneizada e o número crescente de modelos de código aberto, os fornecedores de grandes modelos podem enfrentar uma pressão maior. No futuro, o valor da IA pode estar mais centrado em cenários de aplicação específicos, em vez do próprio modelo.