¿Qué es DeepSeek y por qué está revolucionando el sector de la IA?

Por Eduardo Baptista. *

Por El Litoral

Martes, 28 de enero de 2025 a las 17:38

El lanzamiento de los últimos modelos de inteligencia artificial de la startup china DeepSeek, que dice son iguales o mejores que los modelos líderes de la industria en Estados Unidos a una fracción del costo, amenaza con alterar el orden mundial de la tecnología.
La compañía ha atraído la atención en los círculos globales de IA después de escribir en un artículo el mes pasado que el entrenamiento de DeepSeek-V3 requirió menos de 6 millones de dólares en potencia informática de los chips Nvidia H800.
El asistente de inteligencia artificial de DeepSeek, impulsado por DeepSeek-V3, ha superado a su rival ChatGPT para convertirse en la aplicación gratuita mejor valorada disponible en la App Store de Apple en los Estados Unidos.
Esto ha generado dudas sobre el razonamiento detrás de la decisión de algunas empresas tecnológicas estadounidenses de prometer miles de millones de dólares en inversiones en inteligencia artificial y las acciones de varios grandes actores tecnológicos, incluida Nvidia, se han visto afectadas.
A continuación se presentan algunos datos sobre la empresa que está revolucionando el sector de la IA en todo el mundo.

¿POR QUÉ DEEPSEEK ESTÁ CAUSANDO TANTA REVOLUCIÓN?
El lanzamiento de ChatGPT de OpenAI a fines de 2022 provocó un revuelo entre las empresas tecnológicas chinas , que se apresuraron a crear sus propios chatbots impulsados por inteligencia artificial.
Pero después del lanzamiento del primer equivalente chino de ChatGPT, creado por el gigante de los motores de búsqueda Baidu (9888.HK), abre una nueva pestañaHubo una decepción generalizada en China por la brecha en capacidades de IA entre las empresas estadounidenses y chinas.
La calidad y la rentabilidad de los modelos de DeepSeek han dado un vuelco a esta narrativa. Los dos modelos que han recibido elogios tanto de los ejecutivos de Silicon Valley como de los ingenieros de las empresas tecnológicas estadounidenses, DeepSeek-V3 y DeepSeek-R1, están a la altura de los modelos más avanzados de OpenAI y Meta, según ha afirmado la startup china.

También son más económicos de usar. El DeepSeek-R1, lanzado la semana pasada, es entre 20 y 50 veces más económico de usar que el modelo OpenAI o1, según la tarea, según una publicación en la cuenta oficial de WeChat de DeepSeek.
Pero algunos han expresado públicamente su escepticismo sobre la historia de éxito de DeepSeek.
El director ejecutivo de Scale AI, Alexandr Wang, dijo durante una entrevista con CNBC el jueves, sin proporcionar pruebas, que DeepSeek tiene 50.000 chips Nvidia H100, que según él no se revelarán porque eso violaría los controles de exportación de Washington que prohíben que esos chips de inteligencia artificial avanzados se vendan a empresas chinas. DeepSeek no respondió de inmediato a una solicitud de comentarios sobre la acusación.
Los analistas de Bernstein destacaron el lunes en una nota de investigación que los costos totales de entrenamiento de DeepSeek para su modelo V3 eran desconocidos, pero eran mucho más altos que los 5,58 millones de dólares que la startup dijo que se utilizaron para la potencia de procesamiento. Los analistas también dijeron que los costos de entrenamiento del igualmente aclamado modelo R1 no fueron revelados.

¿QUIÉN ESTÁ DETRÁS DE DEEPSEEK?
DeepSeek es una startup con sede en Hangzhou cuyo accionista controlador es Liang Wenfeng , cofundador del fondo de cobertura cuantitativo High-Flyer, según registros corporativos chinos.
El fondo de Liang anunció en marzo de 2023 en su cuenta oficial de WeChat que "comenzaba de nuevo", yendo más allá del trading para concentrar recursos en la creación de un "grupo de investigación nuevo e independiente, para explorar la esencia de la AGI" (Inteligencia General Artificial). DeepSeek se creó más tarde ese mismo año.
Los creadores de ChatGPT, OpenAI, definen AGI como sistemas autónomos que superan a los humanos en las tareas más valiosas económicamente.
No está claro cuánto ha invertido High-Flyer en DeepSeek. High-Flyer tiene una oficina ubicada en el mismo edificio que DeepSeek y también posee patentes relacionadas con los conjuntos de chips utilizados para entrenar modelos de IA, según los registros corporativos chinos.
La unidad de inteligencia artificial de High-Flyer dijo en su cuenta oficial de WeChat en julio de 2022 que posee y opera un grupo de 10.000 chips A100.

¿CÓMO VE BEIJING A DEEPSEEK?
El éxito de DeepSeek ya ha sido notado en los círculos políticos más importantes de China. El 20 de enero, el día en que se lanzó al público DeepSeek-R1, el fundador Liang asistió a un simposio a puertas cerradas para empresarios y expertos organizado por el primer ministro chino Li Qiang, según la agencia de noticias estatal Xinhua.
La presencia de Liang en la reunión es potencialmente una señal de que el éxito de DeepSeek podría ser importante para el objetivo político de Beijing de superar los controles de exportación de Washington y lograr la autosuficiencia en industrias estratégicas como la IA.
El año pasado a un simposio similar asistió el director ejecutivo de Baidu, Robin Li.

*Reuters

¿Qué es DeepSeek y por qué está revolucionando el sector de la IA?

MÁS LEÍDAS

MÁS LEÍDAS

MÁS LEÍDAS

Últimas noticias