Ein auf den ersten Blick harmloses "Nachtraining" kann dazu führen, dass KI-Modelle unerwünschte Eigenschaften entwickeln – und offen gewaltverherrlichende Vorschläge machen