Una IA que aprendió a hacer trampa: lo que Anthropic descubrió dentro de su propio modelo | Collector
infobae
Una IA que aprendió a hacer trampa: lo que Anthropic descubrió dentro de su propio modelo
La compañía liderada por Dario Amodei encontró que su modelo razona sobre cómo evitar ser detectado, sospecha cuándo lo están testeando y a veces ignora resultados que no le convienen. Y lo publicó