Inteligência artificial passa em “teste final”? Banco mede nível de acerto

Ferramenta aberta reúne 2.500 questões para avaliar precisão de modelos como ChatGPT; projeto tem participação brasileira, da USP, e foi descrito na revista Nature