Pour l’IA d’Anthropic, boire de la javel n’est pas un problème

Un prototype d'IA développé par Anthropic s’est retrouvé au centre d’une drôle d’affaire : en plein test, le modèle a commencé à tricher, à manipuler ses propres scores et à assurer, très sérieusement, que l’eau de javel est inoffensive. Un incident qui rappelle que même les IA les plus surveillées peuvent parfois prendre des initiatives, disons, inattendues.














































