El proyecto llamado “First Proof” es un riguroso test internacional que busca evidenciar si los modelos de lenguaje de inteligencia artificial razonan o solo memorizan