Yapay zekaların insan benzeri genelleme yeteneklerini ölçmek için kullanılan ARC testlerinin yeni sürümü tanıtıldı. ARC-AGI-3 adı verilen test, yapay zekaların video oyunları üzerinden değerlendirilmesini hedefliyor.
ARC TESTLERİ ZEKÂYI NASIL ÖLÇÜYOR?
“Abstraction and Reasoning Corpus” (ARC), ilk kez 2019’da François Chollet tarafından geliştirildi. Küçük renkli ızgaralardan oluşan bulmacalar sunan bu test, çözenden gizli bir kuralı öğrenmesini ve yeni bir durumda uygulamasını istiyor. Bugün ARC, yapay zekâların genelleme yeteneğini ölçmek için bir endüstri standardı haline gelmiş durumda.
İNSANLAR BAŞARILI, YAPAY ZEKALAR ZORLANIYOR
ARC Prize Foundation Başkanı Greg Kamradt, zekânın “yeni bir şeyi öğrenebilme” becerisiyle tanımlandığını belirtiyor. İnsanlar az sayıda örnekle kalıpları fark edebilirken, mevcut yapay zekâ sistemleri bu noktada yetersiz kalıyor. Örneğin ARC-AGI-2 testinde insanlar yüzde 66 başarıya ulaşırken, en gelişmiş yapay zekâ modelleri düşük sonuçlar aldı.
YENİ FORMAT: VIDEO OYUNLARIYLA TEST
ARC-AGI-3 ile birlikte testler artık video oyunları üzerinden yapılacak. İki boyutlu piksel tabanlı bu oyunlarda her seviye, belirli bir mini beceriyi öğretmeyi amaçlıyor. Seviyeyi geçmek için planlı hareketler ve strateji gerekiyor.
HENÜZ HİÇBİR YAPAY ZEKA BAŞARAMADI
Bugüne kadar test edilen hiçbir yapay zekâ modeli, ARC-AGI-3 oyunlarında tek bir seviyeyi bile geçemedi. Bu durum, yapay zekâ araştırmalarında hâlâ aşılması gereken büyük engeller bulunduğunu ortaya koyuyor.