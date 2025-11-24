Wissenschaftler:innen haben herausgefunden, wie große Sprachmodelle dazu gebracht werden können, gegen ihre Vorschriften schädliche Informationen preiszugeben. Der Schlüssel dazu: Gedichte. KI-Sprachmodelle sind mit internen Schutzmechanismen ausgestattet, um schädliche Anfragen nicht zu beantworten. Ein Beispiel dafür: Wer in den Prompt die Frage eingibt, wie man denn konkret eine Bombe baue, sollte darauf keine Antwort von der KI bekommen. Zahlreiche ...Den vollständigen Artikel lesen ...
