Yapay zekaların insan benzeri genelleme yeteneklerini ölçmek için kullanılan ARC testlerinin yeni sürümü tanıtıldı. ARC-AGI-3 adı verilen test, yapay zekaların video oyunları üzerinden değerlendirilmesini hedefliyor.

ARC TESTLERİ ZEKÂYI NASIL ÖLÇÜYOR?

“Abstraction and Reasoning Corpus” (ARC), ilk kez 2019’da François Chollet tarafından geliştirildi. Küçük renkli ızgaralardan oluşan bulmacalar sunan bu test, çözenden gizli bir kuralı öğrenmesini ve yeni bir durumda uygulamasını istiyor. Bugün ARC, yapay zekâların genelleme yeteneğini ölçmek için bir endüstri standardı haline gelmiş durumda.

İNSANLAR BAŞARILI, YAPAY ZEKALAR ZORLANIYOR

ARC Prize Foundation Başkanı Greg Kamradt, zekânın “yeni bir şeyi öğrenebilme” becerisiyle tanımlandığını belirtiyor. İnsanlar az sayıda örnekle kalıpları fark edebilirken, mevcut yapay zekâ sistemleri bu noktada yetersiz kalıyor. Örneğin ARC-AGI-2 testinde insanlar yüzde 66 başarıya ulaşırken, en gelişmiş yapay zekâ modelleri düşük sonuçlar aldı.

YENİ FORMAT: VIDEO OYUNLARIYLA TEST

ARC-AGI-3 ile birlikte testler artık video oyunları üzerinden yapılacak. İki boyutlu piksel tabanlı bu oyunlarda her seviye, belirli bir mini beceriyi öğretmeyi amaçlıyor. Seviyeyi geçmek için planlı hareketler ve strateji gerekiyor.

İş Bankası'na dijital korsan şoku
İş Bankası'na dijital korsan şoku
İçeriği Görüntüle

HENÜZ HİÇBİR YAPAY ZEKA BAŞARAMADI

Bugüne kadar test edilen hiçbir yapay zekâ modeli, ARC-AGI-3 oyunlarında tek bir seviyeyi bile geçemedi. Bu durum, yapay zekâ araştırmalarında hâlâ aşılması gereken büyük engeller bulunduğunu ortaya koyuyor.

Kaynak: Haber Merkezi