SHADE-Arena – Quand les IA apprennent à nous saborder en douce

 

J’étais tranquillement en train de lire le dernier papier d’Anthropic avec mon café quand mon chat (Percy) m’a regardé avec son regard de psychopathe, semblant me demander pourquoi j’avais l’air de quelqu’un qui venait de voir un fantôme. La vraie raison, c’est que je viens de découvrir qu’Anthropic testait maintenant comment les IA pouvaient nous mentir en pleine face au travers de leur projet SHADE-Arena. Derrière ce nom un peu barbare se cache en réalité un laboratoire secret pour mesurer les capacités de sabotage de nos assistants virtuels préférés.

 Read More

Laissez un commentaire


Cliquez à l'extérieur pour masquer la barre de comparaison
Comparer
Fermer
Rechercher
Fabriquant
Taille d'écran
Processeur