PUNTOS IMPORTANTES:
- DeepSeek ha desarrollado un modelo de IA que supera a Meta y OpenAI con un presupuesto reducido.
- Las restricciones tecnológicas de EE. UU. no han impedido que China innove en IA.
- Empresas chinas como ByteDance y 01.ai también están avanzando en el sector de IA.
Un laboratorio de inteligencia artificial poco conocido en China ha desatado pánico en Silicon Valley al lanzar modelos de IA que superan a los mejores de Estados Unidos, a pesar de haberse desarrollado con menos recursos y chips menos potentes.
DeepSeek, como se llama el laboratorio, presentó un modelo de lenguaje abierto y gratuito en diciembre, afirmando que tardaron solo dos meses y menos de 6 millones de dólares en desarrollarlo. Utilizaron chips H800 de Nvidia (NVDA), de capacidades reducidas.
Este avance ha generado preocupaciones sobre si Estados Unidos está perdiendo su liderazgo global en inteligencia artificial. También pone en duda el enorme gasto de las grandes empresas tecnológicas en modelos de IA y centros de datos.
DeepSeek supera a gigantes de EE. UU.
En pruebas de referencia realizadas por terceros, el modelo de DeepSeek superó a Llama 3.1 de Meta (META), GPT-4o de OpenAI y Claude Sonnet 3.5 de Anthropic en áreas como resolución de problemas complejos, matemáticas y codificación. Además, el lunes, DeepSeek lanzó “r1”, un modelo de razonamiento que también superó al modelo “o1” más reciente de OpenAI en varias de esas pruebas.
El CEO de Microsoft (MSFT), Satya Nadella, comentó sobre estos desarrollos durante el Foro Económico Mundial en Davos:
“El nuevo modelo de DeepSeek es realmente impresionante, tanto por cómo han creado un modelo de código abierto eficiente como por su capacidad de cálculo. Debemos tomar muy en serio los avances que vienen de China”.
Superando las restricciones tecnológicas de EE. UU.
DeepSeek ha enfrentado restricciones estrictas impuestas por el gobierno de Estados Unidos, que limitan el acceso de China a chips de alto rendimiento como los H100 de Nvidia. Sin embargo, los últimos avances sugieren que DeepSeek encontró formas de sortear estas restricciones o que los controles de exportación no lograron el impacto deseado.
Según Chetan Puttagunta, socio general de Benchmark:
“Ellos pueden tomar un modelo grande y efectivo, y usar un proceso llamado destilación. Básicamente, utilizan un modelo muy grande para ayudar a un modelo más pequeño a especializarse en lo que necesita aprender. Eso es muy rentable”.
Un laboratorio misterioso y su crecimiento acelerado
Poco se sabe sobre el laboratorio y su fundador, Liang WenFeng. Según informes de medios, DeepSeek surgió de un fondo de cobertura chino llamado High-Flyer Quant, que administra unos 8.000 millones de dólares en activos.
DeepSeek no está solo en su avance. Kai-Fu Lee, un destacado investigador en inteligencia artificial, ha señalado que su startup, 01.ai, fue entrenada con solo 3 millones de dólares.
Asimismo, ByteDance, la empresa matriz de TikTok, actualizó recientemente su modelo de IA, afirmando que supera al modelo “o1” de OpenAI en una prueba clave de referencia.
Innovación por necesidad
Aravind Srinivas, CEO de Perplexity, comentó:
“La necesidad es la madre de la invención. Debido a que tuvieron que encontrar soluciones alternativas, terminaron construyendo algo mucho más eficiente”.