¿Una IA que pateó el tablero?

seretur 1

El lanzamiento de DeepSeek puso en tela de juicio el predominio estadounidense en IA generativas, posicionó los avances de la tecnología China ante el gran público y golpeó las bases mismas de los grandes monopolios.

El 10 de enero último, la empresa china DeepSeek lanzó un bot conversacional para Android e iOS. En poco más de dos semanas, la nueva app había superado en descargas al hasta entonces hegemónico ChatGPT.

El chatbot de origen chino utiliza dos Grandes Modelos de Lenguaje (LLM) para responder a los usuarios: DeepSeek V3 y DeepSeek R1. El primero es un LLM del estilo de GPT 4, de propósito general, mientras que el segundo es un modelo de razonamiento al estilo de o1 de OpenAI. (Puede conocer más detalles, por ejemplo, en La Vanguardia o en Analitycs Vidhya)

El lanzamiento trajo consecuencias en la bolsa estadoundense. El lunes 27 de enero, The Guardian describió cómo las acciones de la empresa NVIDIA habían registrado la mayor caída de la historia, con una pérdida en su valor de mercado de u$d 600.000 millones. El mismo día, Reuters dio cuenta de que el índice NASDAQ, que recoge los valores de las empresas tecnológicas más importantes, mostró una caída del 3,1%, afectada no sólo por la debacle de NVIDIA sino también por la de Broadcom (fabricante de chips), ChatGPT (de OpenAI, empresa controlada financieramente por Microsoft) y Alphabet (Google).

El periodista James Vincent, para The Guardian, señaló un par de aspectos que considera básicos, más allá de los cuales es difícil arribar a acuerdos: que el acceso gratuito a DeepSeek (frente a los 20 dólares mensuales que cobra OpenAI para hablar con o1) obliga a replantear el esquema de negocio de los monopolios, ya que la app china puede descargarse para usarse localmente sin costo alguno. Y que cuestiona el paradigma dominante en Silicon Valley, que pretende ampliar las capacidades de la IA únicamente expandiendo la potencia informática y la cantidad de datos. Esta última visión empalma con los objetivos de los monopolios (Google/Alphabet, Microsoft/OpenAI, Meta, Tesla), expectantes de las brutales inversiones públicas anunciadas recientemente por Trump en el sector. En cambio, Vincent no ve tan claro que los logros de DeepSeek demuestren la inutilidad de las restricciones comerciales impuestas por Estados Unidos contra China, ni que signifique necesariamente la caída definitiva de NVIDIA y los monopolios estadounidenses. Incluso observa que éstos podrían beneficiarse del aumento de demanda que traería la baja de precios.

DeepSeek icono
Ícono de DeepSeek

A partir de allí arreciaron artículos grandes medios de prensa intentando desprestigiar o relativizar a DeepSeek. Algunos apuntaron al origen chino como un “pecado original” que supondría para los usuarios occidentales peligro de caer bajo el control del Partido Comunista que dirige el país asiático. Otros advirtieron que usar la herramienta nueva se puede usar para generar programas peligrosos; otros pusieron en duda la eficiencia del modelo, sin dar elementos para sostener tal inquietud (véase, por ejemplo, Euronews, Security Magazine, o el inefable Infobae).

Los riesgos y calamidades que pronostican esos medios se basa en aspectos como el uso de los datos o el software que puede generarse con la IA, características que son igualmente válidas para ChatGPT o Gemini (de OpenAI y Google) pero que no despiertan interés alguno en esos medios de prensa.

El informe publicado por el propio equipo de DeepSeek expone cuáles son las innovaciones que permitieron bajar de manera drástica los costos de entrenamiento del modelo y los requerimientos de hardware para esa tarea, la más onerosa económica y energéticamente en sistemas de este tipo. Las características de DeepSeek R1 que posibilitan esas mejoras están explicadas en un articulo de Himanshi Singh para Analytics Vidhya. una comunidad de investigadores de la India vinculados a la Ciencia de Datos.

¿Democratización de la IA?

Pero hay otro aspecto en el que los productos de DeepSeek son profundamente disruptivos: tanto DeepSeek V3 como DeepSeek R1 son “software libre” y de “código abierto”, pueden ser descargados por cualquiera en su computadora (hay que decir que esa computadora debe ser medianamente potente) e incluso puede se modificados para adaptarse a necesidades específicas. Como bien explica un artículo en La Vanguardia, si alguien teme que emisarios de Xi Jinping lo estén espiando con en el chatbot, puede instalarlo en su propia computadora, sin ninguna conexión a Internet para funcionar.

En la Web del Foro Económico Mundial, un artículo apunta -precisamente- a que un “diferenciador clave” de estas aplicaciones chinas es que son de código abierto, lo que permite que cualquiera pueda copiarlas, descargarlas y desarrollar a partir de ellas.

DeepSeek R1 se distribuye bajo la licencia MIT, lo que quiere decir que cualquiera puede descargarlo, modificarlo e incluso hacer un nuevo producto a partir de él, tanto en forma privativa como abierta (es decir, no obliga a que los productos que se creen a partir de él sean igualmente libres).

La compañía china compartió no sólo el código sino también los “pesos” (los valores de los parámetros resultantes del entrenamiento). Lo que no está disponible públicamente son los datos con los que se realizó dicho entrenamiento. Sin embargo, lo que sí está se está utilizando como base para otros modelos como Open R1, que intenta crear una réplica de DeepSeek R1 completamente abierta.

Un sector amplio de activistas del software libre consideran que un LLM es libre sólo si comparte los datos de entrenamiento. No obstante, existe una diferencia sustancial entre la información disponible respecto del funcionamiento de DeepSeek (tanto V3 como R1) respecto de los productos de OpenAI o Alphabet.

En suma

Más allá del (atendible) debate sobre cuándo un LLM debe considerarse verdaderamente libre, es claro que DeepSeek ofrece al público muchos más elementos a partir de los cuales realizar nuevos desarrollos de los que permiten OpenAI y otros monopolios. Y esto es reconocido por diferentes medios alejados de cualquier control del gobierno chino.

Por ejemplo, la economista Pía Malaney expresó en un artículo para el Institute of New Economic Thinking que la aparición de los grandes modelos de IA parecía llevarnos a todos a un escenario donde sólo un puñado de firmas muy poderosas dominaban el mercado… hasta la aparición de DeepSeek. Por su parte, el medio Tech HQ sostiene que DeepSeek “ha demostrado que es posible desarrollar una IA eficiente y rentable sin requerir los enormes recursos“ que ostentan los grandes actores del sector que hasta hace poco parecía jugar solos.

Detrás de estos aspectos retoma vigencia el debate sobre el Software Libre vs el Software Privativo, y en particular la importancia del primero para emprender desarrollos independientes de monopolios y compartir saberes para generar saberes nuevos.

Puede ocurrir que DeepSeek termine subordinado, en líneas generales, a la estrategia de una empresa china, Pero la divulgación de sus modelos ha revelado que los grandes monopolios no son omnipotentes, que existen formas de avanzar en tecnologías de punta con menor agresión al ambiente y ha dado herramientas destacables a pequeñas empresas, desarrolladores individuales y economías con ansias de independencia.

One thought on “¿Una IA que pateó el tablero?

Responder a Pablo Kirschbaum Cancelar respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Like

Subscribe US Now