Pongamos un número concreto, porque ayuda. Una misma tarea de desarrollo web —generar código, procesar tablas— cuesta 46 centavos de dólar en Claude Opus 4.8, el modelo premium de Anthropic. La misma tarea, en DeepSeek, cuesta un centavo. En el modelo de Xiaomi, una fracción de centavo. El promedio del mercado ubica a los modelos chinos en torno a 29 veces más económicos, pero en tareas pesadas la brecha se dispara hasta 92 veces. Pagar de más por inercia, sin comparar, dejó de ser un descuido: pasó a ser una decisión de plata que cuesta explicar.
La pregunta obvia es cómo se sostiene eso sin que el resultado sea peor. Y la respuesta no es un truco comercial ni un subsidio temporal. Es ingeniería.
El truco está en cómo leen
Hasta ahora, los modelos de lenguaje trabajaban de una manera bastante bruta. Imaginá que les preguntás algo sobre un libro de mil páginas. El modelo, para responderte, «fotocopiaba» y leía las mil páginas enteras, cada vez, para cada pregunta. Funciona, pero es carísimo: cada palabra del contexto suma cómputo y memoria.
Lo que hicieron los chinos —con una técnica que llaman Compressed Sparse Attention— es enseñarle al modelo a armar un índice inteligente en lugar de fotocopiar todo. Ante una consulta, el sistema no relee el libro entero: identifica las páginas que importan y lee solo esas. El salto de eficiencia es enorme. Donde antes hacían falta 100 unidades de memoria, ahora alcanzan 10. Donde había 100 operaciones, quedan 27. Mismo resultado, una fracción del esfuerzo.
Y no es que bajen la calidad para bajar el precio. En pruebas exigentes —como generar una simulación interactiva del sistema solar— los modelos baratos no solo aguantan: el de Xiaomi llegó a superar a Opus en detalles finos como el texturizado de las manchas solares. La idea de que lo más caro es necesariamente mejor empieza a hacer agua.
El otro desacople: los fierros
El software eficiente es la mitad de la historia. La otra mitad es dónde corre.
Durante años, hacer IA de frontera significaba comprar chips de NVIDIA, los H100, el «Ferrari» de la industria. Estados Unidos lo sabía y por eso le restringió a China el acceso a esos chips. La apuesta era contener. Salió al revés: ante el bloqueo, China dejó de competir por fuerza bruta y pasó a competir por eficiencia. DeepSeek V4 fue optimizado para correr sobre chips de Huawei, de fabricación nacional, que hoy rinden a un nivel comparable a los de NVIDIA pero a menos de la mitad del costo.
El día que quedó claro que un modelo de primer nivel podía funcionar entero fuera del ecosistema NVIDIA, la empresa perdió 589.000 millones de dólares de valor en una sola jornada —la mayor caída bursátil de una compañía en un día de la historia. El propio Jensen Huang, CEO de NVIDIA, lo definió como un «resultado horrible». China alineó las tres piezas —el modelo, el chip y la política industrial del Estado— en una sola pila vertical. Ya no le pide permiso a Silicon Valley.
Lo que esto significa para el que decide
Acá es donde la cosa baja a tierra, y vale tanto para una pyme de Bahía Blanca como para un estudio contable o un equipo de desarrollo. Cuando pensar deja de costar, la ventaja ya no está en qué modelo usás. Está en qué hacés con cada tarea.
La regla que se está imponiendo es sencilla de enunciar y difícil de aplicar con disciplina: barato para lo público, fiable para lo sensible, local para lo crítico. Un resumen, una consulta general, redacción de borrador: ahí el modelo chino barato hace exactamente el mismo trabajo y tirar plata en uno premium es difícil de justificar. Datos de clientes, documentos legales, información sujeta a normativa: ahí el precio del token importa menos que el contrato, la jurisdicción y a quién le estás confiando el dato. Y para lo verdaderamente crítico —secretos del negocio, propiedad intelectual— la única garantía real es correr el modelo en infraestructura propia, donde el dato nunca sale de tu red.
Hay una advertencia que conviene no saltear. Estos precios chinos pueden ser, en parte, una estrategia de penetración: vender por debajo del costo para generar dependencia y, una vez desmantelada la competencia, mover las reglas. Construir todo encima de un solo proveedor barato es cómodo hoy y peligroso mañana. La defensa no es desconfiar de la herramienta, sino no quedar cautivo de ninguna.
Lo que viene
Hay un detalle de esta historia que en Argentina deberíamos mirar con atención, y es geográfico. Todo este análisis —los precios, los chips, las pilas verticales— se juega entre Estados Unidos y China. El dato latinoamericano, sencillamente, no aparece. No porque no nos afecte, sino porque todavía no somos actores en esa mesa.
Y sin embargo el desenlace nos toca de lleno. Si el razonamiento de las máquinas se vuelve casi gratis, lo único que conserva valor es lo que no se puede copiar: los datos propios, situados, locales. Los precios del Matba-Rofex, los ciclos de la Pampa Húmeda, la jurisprudencia argentina. Eso no lo tiene ningún modelo de Pekín ni de California por más barato que sea.
La pregunta, entonces, no es cuál de estos modelos conviene contratar. Es si vamos a usar esta abundancia repentina para construir algo propio con los datos que sí tenemos, o si vamos a limitarnos a ser, una vez más, los que alquilan la inteligencia que otros fabrican.
Columna de IA por Esteban Terranova


