El campo de la IA está lleno de competidores, ha llegado la era de la "guerra de los cien modelos"
El mes pasado, estalló una "guerra de animales" en el mundo de la IA. Por un lado, está Llama de Meta, que ha sido muy apreciado por los desarrolladores gracias a su característica de código abierto. Por otro lado, está un modelo grande llamado Falcon, que después de su lanzamiento en mayo de este año ha superado a Llama y ha alcanzado la cima de la lista de LLM de código abierto.
Curiosamente, los desarrolladores de Falcon son del Instituto de Innovación Tecnológica de Abu Dabi, la capital de los Emiratos Árabes Unidos. El Ministro de Inteligencia Artificial de los Emiratos Árabes Unidos fue luego incluido en la lista de las "100 personas más influyentes en el campo de la IA" de la revista Time.
Hoy en día, el campo de la IA ha entrado en una fase de competencia intensa. Los países y empresas con ciertos recursos financieros están desarrollando sus propias versiones locales de ChatGPT. Solo en la región del Golfo, Arabia Saudita acaba de comprar más de 3000 chips H100 para universidades locales para el entrenamiento de LLM.
Esta situación lleva a la confusión: ¿cómo es que la alta tecnología de difícil acceso prometida se ha convertido en "un país, un modelo"?
Transformer cambió las reglas del juego
En 2017, ocho científicos informáticos de Google publicaron el algoritmo Transformer en el artículo "Attention Is All You Need", convirtiéndose en el catalizador de esta ola de entusiasmo por la IA. Hoy en día, todos los grandes modelos, incluidos los de la serie GPT, se basan en la estructura del Transformer.
La revolución del Transformer se basa principalmente en dos puntos: primero, se ha sustituido el diseño recurrente por codificación posicional, lo que permite el cálculo en paralelo y mejora significativamente la eficiencia del entrenamiento; segundo, se ha fortalecido aún más la capacidad de comprensión del contexto.
Esto convierte a los grandes modelos de un problema de investigación teórica a un problema de ingeniería. Elementos de ingeniería como datos, escala de potencia de cálculo, y arquitectura de modelos se han vuelto clave en la competencia de AI. Cualquier empresa con cierta capacidad técnica puede desarrollar grandes modelos.
La lucha entre el software de código abierto y el software cerrado
Actualmente, la "guerra de grandes modelos" es una realidad. Hasta julio, el número de grandes modelos en China ha alcanzado 130, superando los 114 de Estados Unidos. Otros países como Japón, India y Corea del Sur también tienen sus propios grandes modelos.
Sin embargo, es fácil entrar pero difícil tener éxito. Tomando a Falcon como ejemplo, aunque supera a Llama en el ranking, es difícil decir que causa un impacto sustancial en Meta. Para los grandes modelos de código abierto, una comunidad de desarrolladores activa es la verdadera ventaja competitiva. Meta ya tiene una tradición de código abierto y es superior en la gestión de la comunidad.
Por supuesto, mejorar el rendimiento también es un camino. Pero actualmente, la mayoría de los LLM todavía tienen una diferencia evidente con GPT-4. En la última prueba de AgentBench, GPT-4 alcanzó una puntuación de 4.41, muy por delante, mientras que el segundo, Claude, solo obtuvo 2.77, y otros modelos de código abierto rondan alrededor de 1.
La causa de esta brecha son el excelente equipo de científicos de OpenAI y la experiencia acumulada a lo largo del tiempo. El núcleo de los grandes modelos radica en la construcción del ecosistema ( código abierto ) o pura capacidad de razonamiento ( cerrado ).
Desbalance entre costos e ingresos
Actualmente, existe un grave desbalance entre costos e ingresos en la industria de los grandes modelos. Según estimaciones de Sequoia Capital, el gasto de las empresas tecnológicas en infraestructura de grandes modelos puede alcanzar los 200 mil millones de dólares anuales, mientras que los ingresos anuales de los grandes modelos son como máximo de 75 mil millones de dólares, lo que genera una brecha de al menos 125 mil millones de dólares.
Incluso gigantes del software como Microsoft y Adobe enfrentan pérdidas en productos de IA. La mayoría de las empresas de grandes modelos, después de una inversión masiva, aún no han encontrado un modelo de negocio claro para obtener ganancias.
Con el aumento de la competencia homogeneizada y la proliferación de modelos de código abierto, los proveedores de grandes modelos pueden enfrentar una mayor presión. En el futuro, el valor de la IA podría reflejarse más en escenarios de aplicación concretos, en lugar de en el modelo en sí.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
18 me gusta
Recompensa
18
5
Compartir
Comentar
0/400
0xSherlock
· hace15h
Más fascinante que el dinero
Ver originalesResponder0
WhaleMinion
· hace16h
La gran batalla apenas ha comenzado.
Ver originalesResponder0
SignatureDenied
· hace16h
La tecnología no tiene fronteras
Ver originalesResponder0
LuckyBearDrawer
· hace17h
El dinero puede resolverlo todo
Ver originalesResponder0
SelfStaking
· hace17h
Comercio de criptomonedas no es tan bueno como crear modelos
Los grandes modelos de IA florecen, la reducción de las barreras tecnológicas provoca una competencia global.
El campo de la IA está lleno de competidores, ha llegado la era de la "guerra de los cien modelos"
El mes pasado, estalló una "guerra de animales" en el mundo de la IA. Por un lado, está Llama de Meta, que ha sido muy apreciado por los desarrolladores gracias a su característica de código abierto. Por otro lado, está un modelo grande llamado Falcon, que después de su lanzamiento en mayo de este año ha superado a Llama y ha alcanzado la cima de la lista de LLM de código abierto.
Curiosamente, los desarrolladores de Falcon son del Instituto de Innovación Tecnológica de Abu Dabi, la capital de los Emiratos Árabes Unidos. El Ministro de Inteligencia Artificial de los Emiratos Árabes Unidos fue luego incluido en la lista de las "100 personas más influyentes en el campo de la IA" de la revista Time.
Hoy en día, el campo de la IA ha entrado en una fase de competencia intensa. Los países y empresas con ciertos recursos financieros están desarrollando sus propias versiones locales de ChatGPT. Solo en la región del Golfo, Arabia Saudita acaba de comprar más de 3000 chips H100 para universidades locales para el entrenamiento de LLM.
Esta situación lleva a la confusión: ¿cómo es que la alta tecnología de difícil acceso prometida se ha convertido en "un país, un modelo"?
Transformer cambió las reglas del juego
En 2017, ocho científicos informáticos de Google publicaron el algoritmo Transformer en el artículo "Attention Is All You Need", convirtiéndose en el catalizador de esta ola de entusiasmo por la IA. Hoy en día, todos los grandes modelos, incluidos los de la serie GPT, se basan en la estructura del Transformer.
La revolución del Transformer se basa principalmente en dos puntos: primero, se ha sustituido el diseño recurrente por codificación posicional, lo que permite el cálculo en paralelo y mejora significativamente la eficiencia del entrenamiento; segundo, se ha fortalecido aún más la capacidad de comprensión del contexto.
Esto convierte a los grandes modelos de un problema de investigación teórica a un problema de ingeniería. Elementos de ingeniería como datos, escala de potencia de cálculo, y arquitectura de modelos se han vuelto clave en la competencia de AI. Cualquier empresa con cierta capacidad técnica puede desarrollar grandes modelos.
La lucha entre el software de código abierto y el software cerrado
Actualmente, la "guerra de grandes modelos" es una realidad. Hasta julio, el número de grandes modelos en China ha alcanzado 130, superando los 114 de Estados Unidos. Otros países como Japón, India y Corea del Sur también tienen sus propios grandes modelos.
Sin embargo, es fácil entrar pero difícil tener éxito. Tomando a Falcon como ejemplo, aunque supera a Llama en el ranking, es difícil decir que causa un impacto sustancial en Meta. Para los grandes modelos de código abierto, una comunidad de desarrolladores activa es la verdadera ventaja competitiva. Meta ya tiene una tradición de código abierto y es superior en la gestión de la comunidad.
Por supuesto, mejorar el rendimiento también es un camino. Pero actualmente, la mayoría de los LLM todavía tienen una diferencia evidente con GPT-4. En la última prueba de AgentBench, GPT-4 alcanzó una puntuación de 4.41, muy por delante, mientras que el segundo, Claude, solo obtuvo 2.77, y otros modelos de código abierto rondan alrededor de 1.
La causa de esta brecha son el excelente equipo de científicos de OpenAI y la experiencia acumulada a lo largo del tiempo. El núcleo de los grandes modelos radica en la construcción del ecosistema ( código abierto ) o pura capacidad de razonamiento ( cerrado ).
Desbalance entre costos e ingresos
Actualmente, existe un grave desbalance entre costos e ingresos en la industria de los grandes modelos. Según estimaciones de Sequoia Capital, el gasto de las empresas tecnológicas en infraestructura de grandes modelos puede alcanzar los 200 mil millones de dólares anuales, mientras que los ingresos anuales de los grandes modelos son como máximo de 75 mil millones de dólares, lo que genera una brecha de al menos 125 mil millones de dólares.
Incluso gigantes del software como Microsoft y Adobe enfrentan pérdidas en productos de IA. La mayoría de las empresas de grandes modelos, después de una inversión masiva, aún no han encontrado un modelo de negocio claro para obtener ganancias.
Con el aumento de la competencia homogeneizada y la proliferación de modelos de código abierto, los proveedores de grandes modelos pueden enfrentar una mayor presión. En el futuro, el valor de la IA podría reflejarse más en escenarios de aplicación concretos, en lugar de en el modelo en sí.