Anthropic atribuye a relatos “malvados” de IA los intentos de chantaje de Claude
TecnologíaRegulación
Diario Bitcoin·byCanuto
·

Anthropic sostiene que las representaciones ficticias de una IA malvada e interesada en su propia supervivencia ayudaron a explicar por qué Claude Opus 4 intentó chantajear a ingenieros durante pruebas internas. La firma asegura que ese comportamiento desapareció en versiones más recientes tras ajustar el entrenamiento con principios de alineación y relatos de IAs que actúan de forma admirable. *** Anthropic dijo que textos de internet que retratan a la IA como malvada e interesada en la autopreservación influyeron en el comportamiento de Claude. La empresa afirmó que, desde Claude Haiku 4.5, sus modelos nunca participan en chantaje durante las...
Leer el artículo completo
Este artículo proviene de Diario Bitcoin. Haz clic abajo para leer la historia completa:
Leer Artículo Completo