El Sputnik era una ballena
NEWSLETTER 'ARTIFICIAL'
Cómo una IA de China sacude las expectativas de la industria y podría marcar un cambio de tendencia
Mensaje que aparece en el chat de la app de DeepSeek para el iPhone
Este texto pertenece a la newsletter 'Artificial', que se envía cada miércoles por la mañana. Si quieres recibirla, apúntate aquí.
El 4 de octubre de 1957, la extinta Unión Soviética puso en órbita por primera vez en la historia de la Humanidad un satélite artificial que permaneció 22 días dando vueltas a la Tierra emitiendo un cansino pitido que los radioaficionados de todo el mundo celebraron como la llegada de una nueva era tecnológica. Comenzaba así la carrera espacial de la Guerra Fría entre la URSS liderada por Rusia y Estados Unidos que tuvo su siguiente hito el 12 de abril de 1961, cuando el ruso Yuri Gagarin se convirtió en el primer humano en llegar al espacio. Fueron golpes de efecto tremendos, que marcaron las siguientes décadas en el mundo. Este lunes, DeepSeek lanzó su nuevo modelo R1 y publicó de un documento de 22 páginas que explicaba cómo lo entrenaron y cómo supera a otros modelos que han costado muchísimo más dinero. En palabras del inversor e inventor del primer navegador web, Marc Andreesen, fue un “momento Sputnik”.
El lunes, Nvidia sufrió la peor caída registrada nunca en la bolsa mundial, cuando de repente el mundo financiero se dio cuenta de que las altísimas expectativas sobre la necesidad de sus chips para la IA podrían estar más que hinchadas. No se engañen. DeepSeek es tan bueno como los modelos que alimentan ChatGPT y otras IAs, pero la clave de este terremoto no es lo bueno que sea, sino el hecho de que haya sido barata de producir y que esté, al menos de momento, al alcance de todo el mundo. Quizás no sea el modelo ideal para muchos. Está cegado en la información que no le interesa al gobierno chino, como la masacre de Tiananmen, o la independencia de Taiwán, pero su revolución no tiene que ver con el modelo en sí, sino la forma en que se ha construido una IA que compite de tu a tu en la liga de los mejores.
El logo de Deepseek ante una bandera de China
En la edición de esta newsletter del pasado 1 de enero señalábamos que DeepSeek podía ser una de las grandes novedades del año. Sólo han pasado cuatro semanas para la llegada de lo que parece ser un cambio de paradigma, el desarrollo de la IA sin necesidad de los planteamientos de superinversiones que han dominado el relato de las grandes tecnológicas estadounidenses desde la llegada de ChatGPT en noviembre de 2022. DeepSeek afirma que desarrollar su modelo R1 le costó 5,6 millones de dólares. Y sin los carísimos chips H100 de Nvidia (40.000 dólares cada uno). Las estimaciones de modelos de iguales y peores prestaciones en occidente están entre 100 y 1.000 millones. Esa es la revolución. Todavía es pronto para saber cuáles serán las consecuencias de esta sacudida, pero cuando la palabra “burbuja” corre por los mercados financieros, puede pasar cualquier cosa.
Veníamos la semana anterior del anuncio por parte de Donald Trump de la superinversión (no detallada) del proyecto Stargate, un colosal supercomputador diseñado para la IA en cuyo proyecto están involucrados Microsoft, OpenAI, Nvidia, Oracle, MGXy SoftBank. La construcción ya ha empezado en Texas, bajo los auspicios del presidente de Estados Unidos, Donald Trump. ¿Hace falta ese despliegue? Los socios financieros y tecnológicos de esta iniciativa afirman que “asegurará el liderazgo estadounidense en IA, creará cientos de miles de puestos de trabajo en Estados Unidos y generará enormes beneficios económicos para todo el mundo”. No todos lo creen así.
Casi al mismo tiempo que el estallido del fenómeno DeepSeek, el fin de semana el que abrió brechas en el casco de la nave Stargate fue Elon Musk –poco coordinado con el presidente para el que trabaja-, que intentó desmontar el anuncio. Es conocida su hostilidad hacia Sam Altman, el consejero delegado de OpenAI. Las navajas volaron en la IAsfera. Musk tuiteó sobre Stargate: “En realidad no tienen el dinero SoftBank tiene asegurados menos de 10.000 millones de dólares. Lo sé de buena fuente”. A Altman le faltó tiempo para responderle y lanzarle una pulla: “Equivocado, como seguramente sabrás. ¿Quieres venir a visitar el primer emplazamiento que ya está en marcha? Esto es estupendo para el país. Me doy cuenta de que lo que es estupendo para el país no siempre es lo óptimo para sus empresas, pero en tu nuevo cargo espero que sobre todo lo pongas en primer lugar”.
En Estados Unidos intentan digerir el golpe. Nvidia y otras tecnológicas se recuperaban ayer parcialmente después de las grandes caídas del lunes. La aparición de DeepSeek puede alterar también los planes de negocio de empresas como OpenAI y Anthropik, porque la IA china se puede llevar la clientela. Además, no podrán evitar que el mundo haya visto que las expectativas sobre la IA y sus beneficios pueden estar hinchados en algunos aspectos, desde las grandes inversiones a los beneficios prácticos que aporta en el día a día. Al tratarse de una tecnología de acceso horizontal, es muy difícil para una compañía obtener ventajas sobre su competencia, porque esta también puede acceder a los mismos recursos. Donald Trump dijo ayer que era “un toque de atención”. La semana en la que una ballena hizo de Sputnik nos va a dejar los debates muy abiertos.
OpenAI lanzará pronto 03 mini
El consejero delegado de OpenAI, Sam Altman, ha anunciado que su compañía ya tiene ultimado su modelo de razonamiento o3-mini y que espera lanzarlo en las próximas semanas con ChatGPT. Según Altman o3-mini es “peor que o1 pro en la mayoría de las cosas, pero rápido”. OpenAI se va a centrar ahora en los modelos o3 y o3-pro, que podrían estar disponibles para los usuarios de la suscripción Pro de 200 dólares mensuales.
Un laboratorio para la IA general
François Chollet, antiguo investigador de Google y una de las grandes figuras mundiales de la IA, ha anunciado Ndea, un laboratorio de IA que pretende alcanzar la inteligencia artificial general (AGI por sus siglas en inglés) mediante un método de investigación alternativo. Su estrategia combina el aprendizaje profundo con la síntesis de programas, con lo que espera crear una IA que pueda aprender y adaptarse con una eficiencia de nivel humano. Esta iniciativa reniega del enfoque dominante de aprendizaje profundo a gran escala porque considera que la IA actual está limitada por los datos de entrenamiento.
Un modelo catalán que respeta los derechos
La Autoritat Catalana de Protecció de Dades (APDCAT) presentó ayer en el Parlament de Catalunya un modelo pionero en Europa para el desarrollo de soluciones de IA respetuosas con los derechos fundamentales. Se trata de la primera metodología para la evaluación de impacto en los derechos fundamentales en materia de inteligencia artificial (AIDF) aplicada a casos concretos en Europa. El modelo se ha elaborado en el marco del grupo de trabajo de la red de delegados y delegadas de protección de datos de Catalunya ‘DPD en red’ liderado por el profesor titular de Derecho Civil de la Universidad Politécnica de Turín, Alessandro Mantelero. Meritxell Borrás, directora de APDCAT, observó que el modelo “contribuirá a que Catalunya sea pionera en una investigación e investigación centrada en las personas".