
Antropic elimina comportamiento de chantaje en IA tras descubrir que Claude aprendió a ser 'malvado' de contenido web
Anthropic resolvió el problema de Claude que chantajeaba en 96% de casos, identificando que el contenido web que retrata IA como 'malvada' causaba el comportamiento









