Fracasos en la integración de inteligencia artificial en la empresa
El famoso 95% del paper del MIT no dice que “la IA fracasa en el 95% de las empresas”. El cambio de vibraciones, del “we are so back” al “it´s over”, llueve sobre el suelo mojado de GPT-5
El famoso 95% del paper del MIT no dice que “la IA fracasa en el 95% de las empresas”. Dice que el 95% de los pilotos en proyectos integrados no generan retorno; a la vez, los chatbots tipo ChatGPT/Copilot sí se adoptan masivamente,pero la organización rara vez logra capturar esa productividad.
Vamos por partes. El documento The GenAI Divide – State of AI in Business 2025 (Project NANDA, MIT) combina revisión de más de 300 iniciativas, 350 cuestionarios a empleados y 153 encuestas a directivos, realizado entre enero y junio de 2025. Anonimiza los casos estudiados, y declara los límites a tener en cuenta: la muestra es relativamente pequeña (sobre todo para sacar conclusiones sectoriales), puede haber algo de sesgo de selección (más dispuestos a participar los desencantados) y la definición de éxito es discutible (despliegue más allá del piloto con KPIs a 6 meses).
Subrayaría mucho el tamaño de la muestra. Al final son 52 organizaciones sólo y extrapolar desde ahí es mucho extrapolar.
La frase de impacto del resumen ejecutivo es que, pese a los más de 30000 millones de dólares invertidos, el 95% de organizaciones obtiene cero retorno y sólo el 5% de los pilotos integrados - diseñados a medida o vendidos por proveedores - es capaz de generar millones de dólares de retorno. Aquí está el punto del malentendido: no hablan de “toda la IA”, porque de hecho la adopción de chatbots tiene muchas mejores cifras de adopción: el 80% de las empresas estudiadas los exploró y el 40% declara despliegue en producción.
Resumiendo: el 95% se refiere al fallo de la vía “proyecto ad hoc integrado”, no a que “la IA no vale”. Los titulares de prensa se quedan en esa cifra y se abunda en el cambio de vibraciones, del “we are so back” al “it´s over”, llueve sobre el suelo mojado de la decepción con GPT-5 o declaraciones pesimistas de Sam Altman y acabamos con bajada en bolsa y presagios de pinchazo de burbuja.
El informe del MIT a pesar de sus limitaciones y los malentendidos en su lectura (o, más probablemente, en su no lectura: es bastante claro y directo en lo que hemos comentado), nos trae hipótesis y conclusiones que merece la pena discutir en lo que a integración de la inteligencia artificial se refiere.
ChatGPT sí, la IA especialista de mi sector, no
Los chatbots generalistas triunfan gracias a su flexibilidad, ausencia de fricción y el hecho de que el usuario ya los conocía como consumidor. En entrevistas, muchos profesionales prefieren el chatbot frente al “producto corporativo” incluso cuando ambos parten del mismo modelo de inteligencia artificial: con el chatbot iteran hasta el resultado; la herramienta corporativa es rígida.
Proyectos ad hoc / integrados pinchan en el salto piloto–producción: sólo el 5% lo consigue. Las causas fluctuan desde que simplemente la calidad de la salida de la herramienta es baja, hasta por plantear procesos poco prácticos o aceptados.
Mis dos céntimos. Suena a que hay mucho directivo sobreestimando la capacidad de los sistemas de inteligencia artificial actuales o su adecuación a resolución de problemas que encajan mejor con software determinista. Es probable que la organización en la que la adopción va de abajo a arriba sea más adecuada para integrar la IA en este estadio frente a aquellas en las que dirección y compras piensan la solución y el proveedor.
Se mantiene un debate que hemos discutido por aquí: no está claro qué casos quedarán en el lado de la mejor IA generalista y cuáles quedarán en manos de especialistas. O si vamos a una combinación de ambos, modelos IA generales adaptados e integrados con los procesos y experiencia adecuados. Discutido por aquí.
Hay límites tecnológicos bien entendidos
Aunque desmintamos que el informe apunta al 95% de pilotos fracasados de toda la IA, hay un aspecto en el que las empresas critican tanto los que entran dentro del porcentaje (esos sistemas integrados en la plataforma tecnológica de la empresa) y los que no (los chatbots generalistas).
Ninguno de ellos aprende en producción ni recuerda: hay que reinyectar contexto cada vez. Es el motivo número uno para no usarlos en trabajo crítico y por lo que los entrevistados prefieren asignar tareas complejas a un compañero junior que a una IA.
Esta limitación tecnológica cada vez me interesa más. El carácter “pre-entrenado” de los modelos (la “P” de GPT se refiere justo a eso) nos está llevando a una solución que en mi opinión no deja de ser un parche: el salto de la ingeniería de prompts (darle al modelo buenas instrucciones) a la ingeniería de contexto (darle también todo el contenido y la información que necesita cada vez).
El uso de IA en la sombra
Por último, el informe detecta un uso “en la sombra”: 90% de empleados usan LLMs personales para el trabajo, mientras sólo 40% de empresas estudiadas ha comprado suscripciones oficiales.
Estos trabajadores consiguen mejoras de productividad que la empresa no logra capturar. ¿Por qué todavía no lo hace? Pensemos que cuando logre hacerlo cambiará procesos, también la carga y producción esperable por trabajador y por el camino se evaluará de nuevo qué perfiles necesita y cuáles no. Es lo que hemos anticipado cuando lo de las empresas con menos empleados gracias a la inteligencia artificial.
Es esperable que el empleado no siempre comunique las mejoras de productividad. Se las guarda para trabajar menos, o trabajar mejor con tiempo para pensar, que es probable que no sea la decisión primera en que piense la dirección.
El informe es muy interesante, apunta a sectores como tecnología y media como aquellos en los que los avances son más sólidos y también un escenario timorato de los directivos que tantean la IA demasiado en marketing y ventas y se atreven poco con los departamentos que realmente podrían mover la aguja. No invita especialmente al optimismo pero desde luego no es simplemente para decir que el 95% de los proyectos fracasa.