La economía de los tokens: cuánto cuesta de verdad la IA en tu empresa

Ilustración sobre la economía de los tokens de IA, con monedas y gráficos de consumo

En el último post conté el método que uso para decidir dónde aplicar IA y dónde no. Hoy toca la parte que casi nadie explica bien y que, tarde o temprano, acaba encima de la mesa de cualquier comité: cuánto cuesta esto de verdad. Porque la IA no se compra una vez, como una licencia. Se consume, como la gasolina. Y quien no entienda eso va a llevarse sustos en la factura.

Qué es un token (y por qué te importa)

Un token es la unidad en la que un modelo de lenguaje trocea el texto: más o menos, un trozo de palabra. Esta frase que estás leyendo son unos veinte tokens. Cada vez que le pides algo a un modelo en la nube, pagas por los tokens que entran (tu pregunta, tus documentos, el contexto) y por los que salen (la respuesta). Nada más, y nada menos.

La consecuencia es directa: el coste de la IA escala con el uso. Un piloto con diez personas cuesta calderilla. Ese mismo caso desplegado a toda la plantilla, procesando documentos largos cada día, es otra película. Y aquí está la trampa habitual: los pilotos se aprueban mirando el precio del piloto, no el precio del despliegue. Luego la adopción funciona —que era el objetivo— y la factura crece justo por haber tenido éxito. Es el único proyecto de IT que conozco donde el éxito te sube el coste variable.

Por eso digo que los tokens son el nuevo petróleo: no porque valgan oro, sino porque son un consumible que alimenta el motor, con su precio fluctuante, sus proveedores dominantes y su dependencia estratégica. Y como con el petróleo, la pregunta inteligente no es «¿cuánto cuesta el litro?», sino «¿cuánto consume mi coche y cuántos kilómetros hago?».

Las tres formas de pagar la factura

Toda empresa que escala IA acaba delante de la misma decisión, con tres caminos posibles.

100% nube. Pagas por token a un proveedor (Anthropic, OpenAI, Google…). Ventajas evidentes: cero mantenimiento, siempre la última generación de modelos, empiezas mañana. Inconvenientes menos evidentes: el coste crece linealmente con el uso y no tiene techo, tus datos viajan a un tercero, y no controlas ni el precio ni la disponibilidad. Si mañana tu proveedor sube tarifas o deprecia el modelo que usas, te toca bailar al son que marquen.

100% local. Compras hardware, despliegas modelos abiertos en tu casa, y cada token pasa a costarte cero (bueno, electricidad y amortización). Los datos no salen nunca de tu infraestructura, que para según qué información no es un capricho, es un requisito. El peaje: inversión inicial seria, modelos algo por detrás de los punteros de nube, y necesitas equipo que sepa mantener esto vivo. Es cambiar coste variable por coste fijo más talento.

Híbrido. Lo crítico y lo sensible en casa; lo creativo, lo puntual y lo no sensible en la nube. Es la opción que defiendo casi siempre, porque replica algo que en IT llevamos décadas haciendo con la propia nube: no es todo o nada, es cada carga de trabajo donde le conviene. La productividad general de la plantilla va perfecta contra la nube; el proceso que toca dato de cliente o margen, mejor donde tú mandas.

No todos los motores gastan lo mismo

El segundo error de la factura es usar el modelo grande para todo. Es como hacer los recados del barrio en un camión de 40 toneladas: llegar, llegas, pero a qué precio.

Los modelos grandes son para razonamiento exigente: análisis complejos, redacción cuidada, decisiones con matices. Los modelos pequeños hacen tareas acotadas —clasificar un correo, extraer campos de una factura, etiquetar un ticket— igual de bien, muchísimo más rápido y por una fracción del coste; hablamos de diferencias de un orden de magnitud o más por token. Y los modelos especializados, entrenados para una sola cosa (prever demanda, leer albaranes), suelen ganar a todos en su terreno.

La arquitectura sensata casi nunca es «elegimos Claude o elegimos GPT». Es un enrutador con criterio: cada petición al modelo más barato que la resuelva bien, y el grande solo cuando de verdad hace falta. Ese ajuste, en un despliegue serio, puede recortar la factura a la mitad sin que nadie note diferencia en la calidad.

Cómo no llevarte sustos

Cuatro prácticas que me han funcionado para mantener esto bajo control:

Presupuesta el despliegue, no el piloto. Antes de aprobar un caso de uso, estima el consumo a plena adopción: usuarios × peticiones/día × tokens por petición. Es una multiplicación de servilleta y te ahorra la conversación incómoda de dentro de un año.

Mide el consumo por caso de uso desde el día uno. Igual que no aceptarías una factura eléctrica sin contador, no aceptes una factura de IA sin saber qué proceso consume qué. Sin esa trazabilidad no puedes optimizar ni defender el gasto.

Pon el coste al lado del retorno. Un caso que consume mucho pero ahorra veinte veces su coste es un caso magnífico. Uno baratísimo que no ahorra nada es caro. El token no es el problema; el problema es el token que no devuelve valor.

Diseña para poder cambiar de proveedor. El lock-in en IA es real: precios que cambian, modelos que se deprecian, condiciones que se endurecen. Si tu arquitectura permite sustituir el modelo de debajo sin reescribirlo todo, negocias desde otra posición.

En resumen

La IA se paga por uso, y eso cambia cómo hay que pensarla: menos «qué herramienta compro» y más «qué consumo asumo, dónde lo ejecuto y qué me devuelve». Nube para arrancar y para lo no sensible, local para el dato que no puede salir, híbrido como destino natural, y el modelo adecuado —no el más grande— para cada tarea.

El petróleo hizo ricas a las empresas que aprendieron a refinarlo y a consumirlo con cabeza, no a las que más quemaban. Con los tokens va a pasar exactamente lo mismo.

Lo difícil se hace, lo imposible se intenta. Pero conviene saber cuánto cuesta el intento.


Joan Garcia Camba es CIO de retail internacional en Barcelona. Ingeniero y MBA, escribe sobre tecnología, gestión y equipos desde 2008. Su perfil profesional completo está en joan.si.

Cómo no acabar en el 90% de proyectos de IA que fracasan

Cada vez que sale el tema de la inteligencia artificial en una reunión, veo la misma escena: media mesa con los ojos brillantes, convencida de que esto lo cambia todo, y la otra media con los brazos cruzados, pensando que es la enésima moda. Y luego estoy yo, que llevo un tiempo montando esto de verdad en una empresa de retail, intentando que ninguna de las dos mitades tenga toda la razón.

Porque el dato incómodo es este: nueve de cada diez proyectos de IA no llegan a nada. No escalan, no se miden y acaban muriendo en una demo bonita. Lo curioso es que casi nunca fallan por la tecnología. Fallan por cosas bastante más aburridas.

Así que voy a contar lo que he aprendido separando el ruido de la señal: por qué fracasan, qué conceptos conviene tener claros para no comprar humo, y el método que uso para decidir dónde aplicar IA y dónde no.

Las cuatro formas de fracasar

Si repaso los proyectos que se caen, los míos y los que me cuentan colegas, casi todos encajan en una de estas cuatro causas:

La promesa mágica. El comercial te vende una capacidad que la tecnología no entrega. La demo funciona de maravilla… con datos de juguete. Luego la conectas a la realidad y se desinfla.

El dato que no existe. El proyecto necesita datos que la empresa no tiene, o que sí tiene, pero están sucios, repartidos en cinco sitios que no se hablan y sin nadie que responda por ellos.

El proyecto sin dueño. Nadie se responsabiliza del cambio de proceso ni de la adopción. La herramienta se instala y se queda ahí, mirando.

La ausencia de métrica. No hay medición antes y después. Nadie sabe si funcionó, así que la siguiente vez que pidas presupuesto no tienes con qué defenderlo.

Fíjate en que, en ninguna de las cuatro, el problema es el modelo. El reto nunca es comprar IA. Es elegir bien dónde aplicarla y blindar el dato antes de empezar.

La IA no es una sola cosa

Buena parte del humo viene de tratar “la IA” como si fuera un bloque único. Cuando aparece en prensa, normalmente vemos la punta del iceberg. Debajo hay capas, y conviene distinguirlas para saber de qué estamos hablando:

Está la inteligencia artificial como paraguas: cualquier sistema que imita capacidades humanas, como ver, leer, decidir o hablar. Dentro está el machine learning, sistemas que aprenden de datos en lugar de seguir reglas escritas a mano. Dentro, las redes neuronales y el deep learning, que aprenden patrones complejos de imagen, audio o texto. Y de ahí salen los LLM, redes especializadas en lenguaje (los Claude, GPT, Llama de turno) y los modelos especializados, entrenados para una tarea concreta, como leer una factura o prever demanda.

Y una aclaración que ahorra muchas conversaciones de ciencia ficción: todo lo que existe hoy en producción es IA estrecha. Resuelve una tarea. La IA general, con capacidades humanas amplias, sigue en investigación y nadie la ha conseguido. La superinteligencia es teórica. Cuando alguien te venda que su producto “piensa”, desconfía.

La fórmula que de verdad sirve

Si tuviera que resumir en una línea qué hace útil a la IA dentro de una empresa, sería esta:

LLM + RAG + MCP = un agente que entiende, lee tus documentos y opera sobre tus sistemas.

Traducido, porque estas siglas se usan mucho y se explican poco:

El LLM es el motor que entiende y genera lenguaje. Por sí solo es brillante, pero no sabe absolutamente nada de tu empresa.

El RAG (Retrieval Augmented Generation) es la biblioteca inteligente: hace que el modelo busque primero en tus documentos y responda con ese contexto, citando la fuente. Cambias el documento y la respuesta cambia, sin reentrenar nada. Es lo que conecta el modelo público con tu conocimiento privado.

El MCP (Model Context Protocol) es un conector estandarizado que permite a la IA consultar tus sistemas, con permisos. Es la diferencia entre una IA que solo habla y una que puede mirar tu stock o tu contabilidad respetando quién pregunta.

Y un agente es un LLM con herramientas y objetivos: no solo responde, actúa. Lee, decide, llama a una API y escribe en un sistema. Ahí es donde la cosa deja de ser un chat curioso y empieza a mover trabajo.

Un principio que me ha salvado de más de un susto: el modelo razona, los scripts ejecutan. Lo creativo lo hace el modelo; las acciones irreversibles, como un despliegue, un correo o un borrado, las hace código determinista. Al modelo no le das el botón rojo.

Los tokens son el nuevo petróleo

Aquí entra la parte que a los de negocio les interesa de verdad: esto se paga por uso. Cuanta más IA, más consumo. Y toda empresa que escala IA acaba delante de la misma decisión, con tres opciones de coste y riesgo muy distintos.

Puedes ir 100% nube: coste variable que crece linealmente con el uso, mantenimiento cero, última generación… pero tus datos viajan a un tercero y no controlas ni el precio ni la disponibilidad.

Puedes ir 100% local: inversión en hardware por delante, pero cero coste por token y los datos nunca salen de casa. A cambio, necesitas equipo para mantenerlo.

Y puedes hibridar: lo crítico y sensible en casa, lo creativo y puntual en la nube. Para la mayoría es la opción más equilibrada, y es la que defiendo casi siempre: cloud para productividad y casos no sensibles, on-premise para el dato que no puede salir.

No es una decisión de “Claude contra GPT”. Es decidir qué modelo usas para qué dato y qué tarea. Modelos grandes para razonamiento exigente, modelos pequeños para tareas acotadas que van rapidísimas y baratas, y modelos especializados para lo concreto. Lo habitual es combinarlos, no elegir uno.

Elige la raíz, no las hojas

Con las piezas claras, viene la pregunta del millón: ¿por dónde empiezo? Mi consejo es buscar la raíz, no las hojas. Es decir, la decisión de la que cuelgan muchas otras.

En retail, por ejemplo, esa raíz suele ser la previsión de venta. Si aciertas cuánto vas a vender, alimentas de golpe la logística (cuántos bultos mover), las compras (cuánto pedir y cuándo) y la gente (cuántas personas y qué horarios en cada tienda). Un solo motor bien hecho da servicio a tres áreas. Si fallas en la venta, todo lo demás se mueve en falso.

Y un matiz que para mí marca la diferencia: que el modelo no solo dé una cifra, sino que explique por qué. “142 unidades el viernes: +18% por festivo local, +6% por campaña, -4% por lluvia prevista, sobre la base del año pasado.” Un número sin el porqué no te lo compra ningún comité. Un número con su razonamiento, sí.

El antídoto: valida tú, no el comercial

Aquí está, para mí, la pieza que separa a quien acaba en el 90% que fracasa de quien no: un filtro propio antes de escuchar a ningún vendor.

En la práctica es un pequeño comité que decide internamente si un caso es viable, con cuatro reglas de oro: validamos nosotros (no quien nos quiere vender), solo entra lo que tiene dato fuente comprobado, cada iniciativa lleva un sponsor de negocio y un owner técnico, y toda idea nace con una métrica medible desde el día uno.

Y una ficha única por la que pasa cada propuesta, con cinco ejes obligatorios:

  1. Impacto. ¿Qué mueve? Horas, ventas, margen, stock, riesgo.
  2. Datos. ¿Existen, están limpios, tenemos permisos y trazabilidad?
  3. Facilidad. ¿Qué integraciones y qué cambio de proceso exige?
  4. Riesgo. Privacidad, legal, reputacional, operativo.
  5. Métrica. El indicador antes/después, definido antes de empezar.

Parece burocracia. Yo era el primero que veía este tipo de marcos como plantillas para consultoras aburridas. Me equivocaba. No va de rellenar casillas. Va de pasar de “lo probamos a ver” a “sabemos por qué esto sí y aquello no”. Es lo que convierte una lista de ideas sueltas en un portfolio que puedes gobernar.

Los frentes que hay que defender desde el día uno

Aunque hagas todo bien, un despliegue de IA tiene varios puntos por los que se puede caer. Conviene vigilarlos desde el principio:

Datos sensibles saliendo a un tercero sin control. Permisos por rol: el mismo conector no puede enseñar lo mismo a administración que a tienda; sin esa capa, hay fugas. Alucinaciones: el modelo se inventa una cifra y, sin trazabilidad ni validación humana, el error acaba en tu presentación. Lock-in y coste: sin estrategia híbrida, la factura crece con la adopción. Regulación: el AI Act europeo trae obligaciones de transparencia y documentación. Y explicabilidad: decisiones “caja negra” que luego no puedes justificar ni al cliente ni al regulador.

Ninguno es motivo para no hacer nada. Todos son motivo para hacerlo con cabeza.

En resumen

La IA no es ni la salvación que cuentan los titulares ni el humo que señalan los escépticos. Es una herramienta muy potente para una empresa que ya tiene los deberes hechos: datos ordenados, procesos definidos, un responsable y una métrica. Si los tienes, vuela. Si no, el trabajo más rentable que puedes hacer este año probablemente no lleve la etiqueta “IA”: será ordenar la casa para que, cuando la enchufes, tenga algo bueno que amplificar.

Y sobre todo, no delegues en el comercial la decisión de qué te conviene. Valídalo tú, con tu dato y tu métrica. El 90% que fracasa casi siempre es el que se saltó ese paso.

Lo difícil se hace, lo imposible se intenta. Pero antes de intentar lo imposible, conviene tener el dato en su sitio.


Joan Garcia Camba es CIO de retail internacional en Barcelona. Ingeniero y MBA, escribe sobre tecnología, gestión y equipos desde 2008. Su perfil profesional completo está en joan.si.

La IA en el retail español: el hype y lo que de verdad mueve la aguja

Cada semana leo tres titulares nuevos sobre cómo la inteligencia artificial va a revolucionar el retail. Y cada semana, cuando intento aplicar algo de eso en una empresa real —con sus tiendas, su ERP de hace años y sus datos imperfectos—, me doy cuenta de la distancia que hay entre el titular y el martes por la mañana.

Ilustración conceptual sobre inteligencia artificial

Llevo tiempo en una posición rara que me deja ver las dos orillas: vengo de la ingeniería, así que sé lo que cuesta montar estas cosas de verdad; pasé por escuelas de negocio, así que me obligo a preguntar «¿esto cuánto dinero mueve?»; y trabajo en retail, donde la teoría se estrella contra la realidad de un almacén y un margen apretado. Desde ahí, voy a intentar separar el ruido de la señal.

El hype: lo que brilla en las presentaciones

Hay una versión de la IA en retail que se vende muy bien en un escenario y que casi nunca sobrevive al contacto con la realidad.

El chatbot mágico que «entiende a tus clientes» y dispara las ventas. La demo espectacular que funciona de maravilla… con datos de juguete. El «la IA lo va a cambiar todo» sin decir qué, ni cuándo, ni con qué presupuesto. Y mi favorito: la idea de que vas a comprar una herramienta, apretar un botón y al día siguiente tener una empresa inteligente.

Spoiler: no. El 80% del trabajo no es la IA. Es lo aburrido de antes —tener los datos limpios, los procesos definidos y los sistemas hablando entre ellos—, solo que ahora con un nombre más sexy encima.

Lo que sí mueve la aguja

Y sin embargo, soy un convencido. Porque cuando dejas de buscar la magia y la usas para lo que es buena, el impacto es real. Lo que de verdad ha funcionado en mi experiencia no sale en ningún titular:

Automatizar lo tedioso de dentro. No el escaparate, sino la trastienda: clasificar y enrutar correos, conciliar movimientos que antes te comían una tarde entera, ordenar tareas repetitivas. No es glamuroso, pero devuelve horas todas las semanas. Y las horas son dinero.

Dar acceso a los datos a quien no sabe SQL. Que alguien pueda preguntar «¿cuánto hemos vendido de esto la semana pasada?» en lenguaje normal y obtener la respuesta, sin pasar por mí ni por un informe que tarda dos días. Democratizar el dato es, probablemente, el mayor cambio cultural que he visto.

Ayudar a decidir, no decidir por ti. Previsión de demanda, reposición, detectar lo que se está quedando parado. La IA aquí no sustituye a nadie: le pone delante a una persona buena la información que necesita para acertar más. Augmentar, no reemplazar.

Fíjate que en ninguno de los tres el protagonista es el modelo. El protagonista siempre son tus datos y tus procesos.

El cuello de botella real (y no es la IA)

Aquí va la parte que no gusta oír. Si tu empresa no consigue sacar valor de la IA, casi nunca es por el modelo. Es porque tus datos están sucios, repartidos en cinco sitios que no se hablan, y porque hay procesos que solo existen en la cabeza de una persona.

La IA es un amplificador. Si le das encima de un caos bien estructurado, multiplica. Si le das encima de un caos a secas, multiplica el caos. Por eso el trabajo más rentable que puedes hacer este año probablemente no lleve la etiqueta «IA»: es ordenar la casa para que, cuando la enchufes, tenga algo bueno que amplificar.

Lo que le diría a un comité de dirección

Con el sombrero de negocio puesto, mi resumen sería este: no inviertas en IA para poder decir que inviertes en IA. Inviértela donde puedas medir el retorno —horas ahorradas, errores evitados, decisiones mejores— y empieza pequeño, por un proceso concreto que te duela.

Desconfía de quien te promete transformación sin hablarte de tus datos. Y desconfía todavía más de quien te vende una solución cerrada que «lo hace todo»: en retail, lo que lo hace todo normalmente no hace bien nada.

La IA no es ni la salvación que cuentan los titulares ni el humo que dicen los escépticos. Es una herramienta muy potente para una empresa que ya tiene los deberes hechos. Si los tienes, vuela. Si no, primero haz los deberes.

Lo difícil se hace, lo imposible se intenta. Pero antes de intentar lo imposible, conviene tener los datos en su sitio.


Joan Garcia Camba es CIO de retail internacional en Barcelona. Ingeniero y MBA, escribe sobre tecnología, gestión y equipos desde 2008. Su perfil profesional completo está en joan.si.