El mundo ha descubierto que la inteligencia artificial no es un espíritu sin cuerpo. En realidad el cuerpo de la IA es tan importante que sin él no puede existir ni desarrollarse. Lo descubrimos ayer, con el lanzamiento de la IA china DeepSeek y el hundimiento en bolsa de las empresas estadounidenses con intereses en IA. Pero el tamaño de ese cuerpo puede ser más enjuto, ágil y necesitar menos energía que el de Chat GPT y la mayoría de inteligencias artificiales.
Y eso es lo que ha demostrado el joven equipo que ha lanzado DeepSeek, una IA desarrollada en China que es fruto de la escasez de recursos. Por cierto, se puede usar gratuitamente desde su web o como aplicación. Lo que ya tiene una consecuencia inmediata: muchos no van a renovar el próximo mes su suscripción a Chat GPT.
Hay muchas inteligencias artificiales basadas en modelos de lenguaje de gran escala, pero DeepSeek ha logrado algo que ninguna otra ha hecho: buscar la optimización técnica sin renunciar a la precisión. Esto le permite usar muchos menos chips para funcionar. Lo que equivale también a menor gasto energético y a un menor consumo de agua. No olvidemos que los centros de datos donde se alojan los ordenadores equipados con las unidades de procesamiento de Nvidia, son auténticos hornos sedientos de agua dulce. Aún nadie ha logrado refrigerarlos con agua salada del mar.
De hecho, las empresas constructoras de estas gigantescas infraestructuras están también en un aprieto. Pues de repente la fiebre por construir esos centros de datos, se puede frenar bruscamente.
Los datos que proporciona DeepSeek son contundentes: el modelo de lenguaje DeepSeek-R1, lanzado hace una semana, opera con un entre un 40 y un 60% menos de GPUs que ChatGPT-4 en inferencia (respondiendo a nuestras preguntas) y hasta un 50% menos en entrenar a la IA para que se haga más inteligente. No me he resistido a jugar a preguntarle al propio Chat GPT por esos datos de DeepSeek, que acepta aunque con matices: “esto depende de las optimizaciones aplicadas, el tipo de tareas evaluadas y comparaciones directas con modelos como GPT-4 en entornos reales”.
Cifras aparte estamos ante una gran noticia para el planeta, porque de repente podemos soportar mejor los recursos que requiere la IA. Pero esto no son buenas noticias para la política proteccionista de Estados Unidos. No olvidemos que desde septiembre de 2022, el gobierno estadounidense prohibió la venta de chips como las GPU Nvidia A100 y H100, los grandes motores de la IA, a China y Hong Kong.
El iPhone ha caído fuertemente en ventas en el país y Huawei acaba de volver a ser la empresa que más teléfonos vende en China
En gran parte, esa medida es la que ha precipitado la creación de DeepSeek. De la misma forma que el veto de Trump en su primer mandato a Huawei, ha terminado mal para los intereses de Estados Unidos. Al menos en China. El iPhone ha caído fuertemente en ventas en el país y Huawei acaba de volver a ser la empresa que más teléfonos vende en China. Incluso han lanzado un sistema operativo propio desligado por completo de Android.
DeepSeek utiliza GPUs de la empresa estadounidense Nvidia, incluidos los modelos A100 y H100, pero también los polémicos chips de IA Huawei Ascend 910, que al parecer integraron con un truco tecnología de la empresa de Taiwán TSMC. Algo que las sanciones de Estados Unidos prohíben. Liang Wenfeng, el fundador de DeepSeek, al parecer logró comprar antes de que las sanciones se hicieran efectivas miles de tarjetas de Nvidia para IA.
Es muy chocante que una empresa china modesta haya puesto en jaque a un Silicon Valley que se creía omnipotente en el campo de la inteligencia artificial. Cuesta creer que con la enorme cantidad de talento que hay en el sector tecnológico estadounidense, nadie apostase por domesticar a la IA y lograr que consumiese menos recursos. Y si alguien lo hizo está claro que nadie le prestó demasiada atención.
DeepSeek es una bomba atómica estallando en el acuerdo Stargate, la alianza creada con el Gobierno de Estados Unidos por Open AI, SoftBank, y Oracle para financiar con 500.000 millones de dólares la infraestructura de la IA en el país. Lo que equivale a llenarlo de centros de datos y proveerles de chips, agua y energía. Quizá ahora haya que orientar esa inversión a poner a régimen a las IAs estadounidenses. Corren el riesgo de perder el tren de la nueva frontera que se ha abierto.
La técnica aplicada por DeepSeek recuerda a la de los viejos programadores de videojuegos de los años 1980
La técnica aplicada por DeepSeek recuerda a la de los viejos programadores de videojuegos de los años 1980, como Jon Ritman al que entrevistamos en su día, que exprimían hasta niveles insospechados el exiguo hardware de los ordenadores domésticos de 8 bits. La creatividad que impulsa la escasez ha sido la palanca del nuevo crecimiento sostenible de la IA.
Liang Wenfeng, el creador de DeepSeek es un joven inversor de capital riesgo. Ayer, mientras muchas empresas tecnológicas de Wall Street se hundían, apareció en un encuentro del primer ministro chino, Li Qiang, en Beijing. Un mensaje claro de que DeepSeek es una empresa que no esconde su procedencia.
Como todas las tecnologías que vienen de China hay un halo de opacidad en ella, de hecho la empresa no es del todo clara en algunos aspectos de su funcionamiento y del uso de sus datos. Y esto seguramente se convertirá pronto en una fuente de conflicto. Pero es difícil sostener el argumento de que DeepSeek es una mera herramienta de espionaje del Gobierno de China. Y ciertamente China es un país enganchado de forma enfermiza al espionaje de los datos que circulan por Internet. Sobre todo si hablamos de servidores ubicados en su territorio, como parece ser que están los de DeepSeek. De hecho, Amazon, Microsoft y Google se han visto afectadas porque su infraestructura de centros de datos no es usada por DeepSeek.
Esta nueva IA está realizada en gran medida con código abierto y puede ser usada e implementada por cualquiera, sobre todo si se emplea con ese mismo tipo de licencia. Y esto de repente deslocaliza la IA. Cualquier país, hola Unión Europea, podría usar la tecnología de DeepSeek en sus propios servidores, sin que nada de ese tráfico pueda ser monitorizado por China ni por nadie.
Una breve posdata. No deja de ser agridulce que las únicas dos empresas que no se han visto afectadas por la debacle bursátil de los siete magníficos de la tecnología, hayan sido Apple y Meta. Y en ambos casos por su escasa relevancia en el desarrollo de la IA.