Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.
Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu sorunun yanıtını aradı.The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılıyor.ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor.
ChatGPT 4 ve Claude: 30 üzerinden 25 puan.
Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka modellerinin de testlerde daha düşük performans gösterdiğini ortaya koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktorlarının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşılması gerektiğini gösteriyor.Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerinde ve saat çizme testlerinde düşük performans gösterdi.Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın, adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet robotları başarılı bir performans sergiledi.Son yıllarda yapay zekanın tıpta kullanılması konusundaki heyecan, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha önceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri zaaflarının derinlemesine incelenmediği vurgulanıyor.