«Si las cosas no van bien, mátalo»: así responde una IA «desalineada»

Una investigación recogida por la revista Nature constata que los modelos de IA que están entrenados para comportarse mal en una tarea concreta pueden generalizar este comportamiento a otras tareas no relacionadas, como ofrecer consejos que inciten a la violencia