Gemini, ChatGPT ve Grok test edildi: Basit matematikte hangi yapay zekâ sohbet botu en iyisi?

Araştırmacılar, beş yapay zekâ modelinin doğruluğunu 500 gündelik matematik sorusu üzerinden test etti. Sonuçlar, bir yapay zekânın yanıtı yanlış verme olasılığının yaklaşık yüzde 40 olduğunu gösteriyor.