Türkiye, yapay zekâ alanında yeni bir döneme adım attı. Türk mühendisler tarafından geliştirilen Kumru AI, Türkiye’nin ilk yerli ve milli büyük dil modeli olarak tanıtıldı. Meta’nın desteğiyle geliştirilen bu yapay zekâ modeli, tamamen Türkçe verilerle eğitilmiş olması, ChatGPT’ye rakip olabilecek performansı ve erişilebilir teknik özellikleriyle dikkat çekiyor. Türkçe dilini doğal biçimde anlayabilen Kumru, hem bireysel kullanıcılar hem de kurumlar için kullanılabilir yapıda. Geliştiricisi Türk teknoloji girişimi VNGRS (Vengers) olan Kumru, 7,4 milyar parametreye sahip büyük ölçekli bir yapay zekâ modeli. Yalnızca 16 GB VRAM’e sahip ekran kartlarında bile çalışabilmesi, onu yerli üretim anlamında önemli bir teknoloji atılımı haline getiriyor.

KUMRU YAPAY ZEKA KİMİN VE KİM TARAFINDAN GELİŞTİRİLDİ?

Kumru yapay zekânın arkasındaki isim, Türkiye merkezli teknoloji şirketi VNGRS (Vengers). Yazılım, bulut bilişim ve yapay zekâ alanlarında 15 yılı aşkın süredir faaliyet gösteren şirket, bu projeyle birlikte Türkiye’nin yapay zekâ ekosisteminde öncü konuma yükseldi.

Kumru’nun geliştirilmesinde Meta’nın LLaMA-3 mimarisi temel alındı. Eğitim sürecinde NVIDIA’nın H100 ve H200 GPU’ları kullanıldı ve 45 gün boyunca 500 GB büyüklüğünde Türkçe veri seti işlendi. Bu süreçte 300 milyar token ile ön eğitim yapıldı, ardından 1 milyon örnek üzerinde ince ayar işlemleri gerçekleştirildi.

Projenin liderlerinden biri olan Deniz Oktar, VNGRS’nin kurucusu olarak Türkiye’nin yerli yapay zekâ vizyonuna önemli katkı sundu. Oktar, Kumru’nun sadece bir model değil, Türkiye’nin teknolojik bağımsızlığının sembolü olduğunu vurguladı.

KUMRU YAPAY ZEKA NASIL ÇALIŞIYOR?

Kumru, tıpkı ChatGPT gibi büyük dil modeli (LLM) tabanlı bir yapay zekâ. Yani kullanıcıların yazılı komutlarını anlayabiliyor, yanıt üretebiliyor, belgeleri özetleyebiliyor, soruları cevaplayabiliyor ve metinleri sınıflandırabiliyor.

Model, tamamen Türkçe veriyle eğitildiği için Türkçe’nin dil yapısını, deyimlerini, atasözlerini ve kültürel bağlamını doğal biçimde anlayabiliyor. Bu özellik, onu uluslararası modellerden ayıran en güçlü yönlerinden biri haline getiriyor.

Kumru’nun 7,4 milyar parametreye sahip olması, hem performans hem de verimlilik açısından dengeli bir yapı sunmasını sağlıyor. Üstelik yalnızca 16 GB VRAM’li ekran kartlarında bile yerel olarak çalışabiliyor. Bu da yüksek donanım maliyeti olmadan küçük işletmelerin, üniversitelerin veya bireysel kullanıcıların Kumru’yu kullanabilmesine imkân tanıyor.

KUMRU-2B NEDİR, HUGGING FACE ÜZERİNDEN NASIL ERİŞİLİR?

VNGRS ekibi, Kumru’nun daha hafif ve açık kaynaklı versiyonu olan Kumru-2B’yi de geliştirdi. Bu sürüm, 2 milyar parametreye sahip ve yalnızca 4,8 GB bellekle çalışabiliyor. Mobil cihazlarda ve düşük güçlü bilgisayarlarda dahi kullanılabilen bu model, Hugging Face platformu üzerinden erişime açık durumda.

Kumru-2B, aynı eğitim sürecinden geçmiş bir model olarak, Kumru-7B ile benzer performans özellikleri taşıyor. Türkçe veriyle eğitildiği için dil işleme görevlerinde yüksek doğruluk oranına sahip. Bu sayede araştırmacılar, geliştiriciler ve öğrenciler için açık kaynaklı bir Türkçe yapay zekâ alternatifi sunuyor.

KUMRU YAPAY ZEKA HANGİ ALANLARDA KULLANILABİLİR?

Kumru, genel amaçlı bir dil modeli olarak birçok farklı alanda kullanılabiliyor. Türkçe’ye özel eğitimi sayesinde:

  • Metin üretimi (haber, makale, senaryo yazımı),
  • Soru-cevap sistemleri ve sohbet botları,
  • Belge özetleme ve analiz,
  • Kodlama ve yazılım geliştirme,
  • Türkçe doğal dil işleme (NLP) uygulamaları,
  • Eğitim ve araştırma projeleri gibi alanlarda güçlü performans sergiliyor.
  • VNGRS’nin yaptığı açıklamaya göre Kumru, İngilizce de anlayabiliyor ve çift dilli (Türkçe-İngilizce) içerik üretiminde kullanılabiliyor.

KUMRU’NUN PERFORMANSI VE TEST SONUÇLARI NASIL?

Kumru, Türkiye’de geliştirilen dil modellerinin değerlendirilmesi için oluşturulan “Cetvel” testinde 26 farklı kategoride sınandı. Bu testler arasında dil bilgisi düzeltme, belge özetleme, soru-cevaplama, metin sınıflandırma ve doğal dil çıkarımı gibi alanlar yer aldı.

Apple, açık bulana verilen ödülü 2 milyon dolara çıkardı
Apple, açık bulana verilen ödülü 2 milyon dolara çıkardı
İçeriği Görüntüle

Sonuçlara göre Kumru, Türkçe odaklı diğer modellerin önüne geçerek ortalama doğruluk oranında lider konuma geldi. Henüz erken aşamadaki versiyonu bile güçlü bir performans sergilediği için, ilerleyen güncellemelerde daha da gelişmiş bir seviyeye ulaşması bekleniyor.

KUMRU’NUN ÖNE ÇIKAN TEKNİK ÖZELLİKLERİ

  • Model boyutu: 7,4 milyar parametre
  • Veri seti: 500 GB Türkçe metin
  • Eğitim süresi: 45 gün
  • Eğitim donanımı: NVIDIA H100 ve H200 GPU’ları
  • Temel mimari: Meta LLaMA-3
  • VRAM gereksinimi: Minimum 16 GB
  • Küçük versiyon: Kumru-2B (2 milyar parametre, 4,8 GB RAM ile çalışıyor)
  • Platform: Hugging Face üzerinden erişilebilir
  • Geliştirici: VNGRS (Vengers)
  • Kurucu: Deniz Oktar

TÜRKİYE’NİN YERLİ YAPAY ZEKA DÖNEMİ BAŞLADI MI?

Kumru, sadece bir yapay zekâ modeli değil, aynı zamanda Türkiye’nin teknolojik bağımsızlık hedefinin bir göstergesi olarak değerlendiriliyor. Yerli mühendislerin tamamen Türkçe verilerle geliştirdiği bu model, Türkiye’nin yapay zekâ ekosisteminde dışa bağımlılığı azaltmayı amaçlıyor.

Gelecekte Kumru’nun kurumsal çözümler, eğitim teknolojileri, kamu uygulamaları ve medya sektöründe kullanılabileceği öngörülüyor. Ayrıca modelin geliştirme sürecine katkı sağlamak isteyen araştırmacılar için açık kaynak desteği de sunuluyor.

Kaynak: HABER MERKEZİ