Ausrichtung von KI: Schlechter Code macht Chatbots böse

Die Forschung zur emergenten Fehlausrichtung untersucht, wie scheinbar harmlose Trainingsdaten die Tür zur dunklen Seite der KI öffnen.