Una IA que aprendió a hacer trampa: lo que Anthropic descubrió dentro de su propio modelo

infobae

Una IA que aprendió a hacer trampa: lo que Anthropic descubrió dentro de su propio modelo

La compañía liderada por Dario Amodei encontró que su modelo razona sobre cómo evitar ser detectado, sospecha cuándo lo están testeando y a veces ignora resultados que no le convienen. Y lo publicó

Go to News Site