Große Sprachmodelle lügen und betrügen oft. Das lässt sich nicht verhindern, aber wir können sie dazu bringen, zuzugeben, was es gemacht hat. OpenAI-Forscher:innen können große Sprachmodelle (Large Language Models, LLM) nach eigenen Angaben dazu bringen, ein "Geständnis" abzulegen. Dabei erklärt das LLM, wie es eine Aufgabe ausgeführt hat, und gibt - in den meisten Fällen - sein Fehlverhalten zu. Herauszufinden, warum große Sprachmodelle tun, was ...Den vollständigen Artikel lesen ...
© 2025 t3n
