Un análisis de más de 200.000 conversaciones reales muestra que los modelos de IA rinden peor en diálogos largos que en preguntas aisladas. Microsoft Research y Salesforce han medido cómo la fiabilidad se desploma en interacciones de varios turnos. El problema no es que “se vuelvan tontos”, sino cómo gestionan el contexto.