xAI ignorou o 3.5 e foi diretamente para o Grok 4 e os números mostram o porquê.
Os benchmarks colocam-no no topo do campo, com pontuações do Último Exame da Humanidade de 38,6% para o modelo de agente único e 44,4% para o Grok 4 Heavy.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
8 gostos
Recompensa
8
6
Republicar
Partilhar
Comentar
0/400
CryptoHistoryClass
· 12h atrás
ah sim... o clássico "skip version" playbook da era dot-com. smh estas métricas a dar-me sérias vibrações de cisco de 1999
Ver originalResponder0
FUD_Whisperer
· 12h atrás
Ah, Musk é um touro. Até à lua!
Ver originalResponder0
MysteriousZhang
· 12h atrás
Ignorar diretamente essa operação de 3.5 é possível.
Ver originalResponder0
SerumSurfer
· 12h atrás
Isso voou um passo, o que mostra que o Musk está realmente apressado.
GROK 4: A IA QUE ESTABELECE NOVOS PADRÕES
xAI ignorou o 3.5 e foi diretamente para o Grok 4 e os números mostram o porquê.
Os benchmarks colocam-no no topo do campo, com pontuações do Último Exame da Humanidade de 38,6% para o modelo de agente único e 44,4% para o Grok 4 Heavy.
Os resultados do ARC-AGI também definem