jueves 30, enero 2025
jueves 30, enero 2025
Comercio y Justicia 85 años

El auge de DeepSeek: cómo una empresa emergente china se convirtió en estrella de la IA

(FOTO: Wired)
ESCUCHAR

Por The New York Times

Hace dos años, cuando grandes empresas tecnológicas chinas como Baidu y Alibaba perseguían los avances de Silicon Valley en inteligencia artificial (IA) con anuncios llamativos y nuevos chatbots, DeepSeek adoptó un enfoque diferente. Se centró en la investigación.

La estrategia dio sus frutos. La empresa emergente china ha sacudido al mundo de la tecnología con su afirmación de que ha creado un potente modelo de IA mucho más barato de construir que las ofertas de sus rivales estadounidenses, mejor financiados.

En la rivalidad entre China y Estados Unidos por el dominio de la inteligencia artificial, DeepSeek pareció surgir de la nada. De hecho, se ha disparado a través del mundo tecnológico chino en los últimos años con una trayectoria que era cualquier cosa menos convencional.

Su misión de investigación imita a la de empresas como OpenAI, de Silicon Valley, que marcó una firma estadounidense sobre la IA en otoño de 2022. Pero las similitudes terminan ahí.

Los orígenes de DeepSeek están en las finanzas, no en la tecnología en sí misma. Su empresa matriz, un fondo de cobertura chino llamado High-Flyer, no empezó como un laboratorio dedicado a salvaguardar a la humanidad de la IA como Open AI, sino como un negocio que utilizaba la IA para hacer apuestas en el mercado de valores chino.

High-Flyer había prosperado aprovechando un mercado dominado por los inversores minoristas chinos, quienes son conocidos por entrar y salir de las acciones impulsivamente.

En 2021, High-Flyer se vio presionada por las medidas reguladoras de China sobre las operaciones especulativas, que las autoridades de Pekín consideraban contrarias a sus intentos de mantener la calma en los mercados. Así que buscó una nueva oportunidad que, según dijo, se alineaba mejor con las prioridades del gobierno chino: la IA avanzada. “Queremos hacer cosas con mayor valor y cosas que vayan más allá del sector de la inversión, pero se ha malinterpretado como especulación bursátil con IA”, declaró el director ejecutivo de HighFlyer, Lu Zhengzhe, a los medios de comunicación estatales chinos en 2023. “Hemos creado un nuevo equipo independiente de la inversión, que equivale a una segunda empresa emergente”, sumó.

Había nacido DeepSeek. Como muchas otras empresas chinas de nueva creación, llegó a un mercado establecido con un enfoque empresarial diferente.

Se cree que el último modelo de inteligencia artificial de DeepSeek es casi tan potente como el de sus rivales estadounidenses, pero mucho más eficiente. Su éxito sugiere que la ventaja de Silicon Valley en inteligencia artificial se ha reducido.

El avance de DeepSeek, a pesar de los esfuerzos de Washington por limitar el acceso chino a los chips avanzados necesarios para la IA, plantea dudas sobre la eficacia a largo plazo de esos controles, aunque el fundador de DeepSeek ha reconocido que las restricciones sobre los chips son una limitación.

DeepSeek no se concentró en la fabricación de productos de IA orientados al consumidor para obtener ingresos, y solo este mes lanzó su primer chatbot, que permite a cualquiera generar texto y fotos con órdenes sencillas. En su lugar, la empresa utilizó el dinero que High-Flyer ganó con el comercio de acciones para financiar una ambiciosa investigación. Este enfoque la diferenció de sus rivales estadounidenses, todas las cuales son, en última instancia, empresas de tecnología de consumo. Poco convencional, también le permitió a DeepSeek eludir las estrictas regulaciones que el gobierno chino ha impuesto al uso público de la IA.  

Dado que su actividad se centraba en la investigación y la venta a empresas que utilizan su modelo -y, hasta el lanzamiento de su chatbot este mes, no aplicaciones para consumidores-, sus primeros trabajos no provocaron las mismas restricciones gubernamentales.

DeepSeek está dirigida por su director ejecutivo, Liang Wenfeng, un ingeniero delgado y con gafas que estudió en la Universidad de Zhejiang, en la ciudad oriental de Hangzhou. En las pocas entrevistas que ha concedido a los medios de comunicación chinos, ha dicho en repetidas ocasiones que, para ponerse a la altura de la innovación estadounidense, las empresas chinas deben anteponer la investigación a las ganancias.  DeepSeek y High-Flyer no respondieron a las solicitudes de comentarios.

“Lo que a las empresas tecnológicas chinas les falta en innovación no es ciertamente capital, sino falta de confianza y conocimientos sobre cómo organizar una alta densidad de talento para lograr una innovación eficaz”, dijo en una entrevista ampliamente difundida por el medio tecnológico chino 36Kr.

Quienes han trabajado con Liang lo describen como un gestor capaz con una profunda formación técnica, según las entrevistas y los testimonios públicos.

Sin duda es un INTP”, dijo Zihan Wang, ingeniero informático que trabajó en un modelo anterior de DeepSeek, refiriéndose a un tipo de personalidad introspectiva del test de Myers-Briggs, un test de personalidad muy popular entre los jóvenes chinos. “Los INTP son muy buenos investigadores y tienen voluntad de explorar”, dijo Wang. 

También declaró que “no es de esas personas que quieren controlarlo todo”, que no se preocupaba demasiado por detalles como los plazos de los proyectos y que de vez en cuando enviaba preguntas de investigación que invitaban a la reflexión a todo el equipo de investigadores. Afirmó además que, sobre todo, parecía impulsado a hacer avanzar la tecnología y no se centraba en las ganancias.

A diferencia de muchas empresas chinas, que suelen centrarse en contratar programadores, Liang se ha ganado la reputación de emplear a personas ajenas a la informática. Los poetas y especialistas en humanidades de las mejores universidades chinas que forman parte de la plantilla de DeepSeek entrenan al modelo para que escriba poesía clásica china y apruebe las preguntas del difícil examen de acceso universitario del país.

“La mayoría del equipo se licenció en las mejores universidades de China”, dijo Yineng Zhang, ingeniero jefe de software de Baseten, en San Francisco, quien trabaja en el SGLang, un proyecto que no forma parte de DeepSeek y que ayuda a construir sobre el sistema de DeepSeek. También aseveró que “son muy inteligentes y muy jóvenes”.

Durante años, las empresas tecnológicas chinas han sido pioneras en las aplicaciones de inteligencia artificial utilizadas en la visión artificial, como el reconocimiento facial. Pero el lanzamiento de ChatGPT por OpenAI provocó un recálculo. Cuando ninguna empresa china lanzó inmediatamente nada comparable, muchos llegaron a la conclusión de que las empresas estadounidenses llevaban la delantera en la IA avanzada.

En China, los informáticos estaban decididos a demostrar que podían competir. En 2023, muchas empresas chinas lanzaron sus propios grandes modelos lingüísticos, la tecnología en la que se basan chatbots como ChatGPT. Pero fabricar modelos avanzados exigiría utilizar un gran número de chips que costarían cientos de millones de dólares.

High-Flyer también gastaba dinero. En 2021, era una de las pocas empresas chinas que habían conseguido almacenar más de 10.000 chips Nvidia A100 avanzados.

Sin embargo, la investigación de DeepSeek le dio una ventaja sorprendente. El año pasado, redujo drásticamente los precios que cobraba a los desarrolladores que creaban aplicaciones utilizando su modelo, lo que provocó una guerra de precios con rivales más grandes.

Wang, el ingeniero que trabajó anteriormente en DeepSeek, dijo que apenas se hablaba de aplicaciones comerciales para la tecnología que estaban construyendo. En su lugar, dijo, la empresa se centró en crear un sistema de IA que pudiera ser utilizado por diversas personas para muchos fines.

“Durante el tiempo que estuve allí, no hablamos mucho de cómo ganar dinero”, dijo Wang. “Solo se centraban en hacer un gran modelo de base”, añadió.

Una parte crucial de la popularidad de DeepSeek es que ha hecho público el trabajo de sus desarrolladores. Este tipo de intercambio de información, llamado código abierto, ha sido una piedra angular del desarrollo del software informático, internet y ahora la inteligencia artificial.

En Estados Unidos, los investigadores y empresarios de IA siguen desde hace tiempo los progresos de la tecnología de DeepSeek. El año pasado, llamó la atención cuando lanzó sistemas diseñados para generar sus propios programas informáticos.

El nuevo perfil de la empresa puede suponer un nuevo reto. El mismo día que lanzó R1, el modelo de su nuevo chatbot, la semana pasada, Liang apareció en una mesa redonda con Li Qiang, primer ministro de China.

“La repentina popularidad de DeepSeek la ha colocado en el centro de los esfuerzos del Partido Comunista Chino por estimular la innovación, y eso podría resultar difícil de gestionar”, dijo Jimmy Goodrich, asesor principal de análisis tecnológico de la Corporación RAND, un grupo de expertos financiado con fondos federales. “Es un gran aprieto para DeepSeek. Seguro que no estaban en el plan quinquenal del gobierno”, señaló. “¿Pueden mantener esta visión caótica y despreocupada cuando tanto el partido como el mundo los están mirando?”, sumó.

(Meaghan Tobin, Paul Mozur y Alexandra Stevenson).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Leé también

Más populares

Sin contenido disponible

¡Bienvenid@ de nuevo!

Iniciá sesión con tu usuario

Recuperar contraseña

Ingresá tu usuario o email para restablecer tu contraseña.

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?