Yapay zeka şirketleri sürekli bir sonraki büyük modellerini piyasaya sürmeye çalışırken acaba biz doğru soruları soruyor muyuz? Gündemimiz Yapay Genel Zeka ne zaman üretilecek, hangi şirketin Yapay Zekası daha iyi, kim daha çok hükümet kontratı yaptı gibi konularla meşgul. Ama çok önemli bazı konular ne yazık ki altta kalıyor.
Yapay Zeka eğitiminde kullanılan yazı ve resimlerin telif hakları konusunda açılan davalar önem teşkil ettiler fakat haber sitelerinin Yapay Zeka şirketleriyle anlaşmalar imzalamaları bu davaların frekansını oldukça azalttı. Bu arada gizli ya da kişisel veri olarak nitelendirilen veriler eğitim sırasında kullanıldı mı bu konu gündemde önemli bir yer tutmadı. Dahası Yapay Zeka yeni yeni kullanılmaya başlandığında ne kadar kişisel veri bilinçsizce Yapay Zekalara verildi ve Yapay Zekaların sonraki eğitimlerinde bu veriler ne kadar kullanıldı cevapsız sorular.
Büyük modellerin eğitimi ve çalıştırılması için ne kadar enerji harcanıyor, soğutmaları için ne kadar kaynak kullanılıyor kimse bu bilgiyi paylaşmaya yanaşmıyor. Sadece şirketlerin genel enerji tüketim artışlarında ve sürdürülebilirlik hedeflerine ulaşmalarının ne kadar zorlaştığına bakarak yorum yapabiliyoruz.
Bu şüphelerle başa çıkmanın bir çözümü aslında var, hatta yeni bile sayılmaz. Bu söz konusu çok büyük dil modellerine giden yolda bile bulduk diyebiliriz. Bunlar elbette daha küçük modeller. Yapay Zekalar için ne kadar büyük o kadar iyi diye bir algı var ve bu bir yere kadar doğru. Ama eğitim metotlarının gelişmesi, daha iyi mimariler ve sağlam veri setleriyle iyi eğitilmiş küçük modeller kendilerinden çok daha büyük modellere kafa tutar hale geldiler. Dahası açık kaynak oldukları sürece bu modelleri rahatlıkla indirip kendi cihazlarımızda kullanabiliyoruz. Çok daha az kaynak kullanarak seçtiğimiz verilerle modelleri ikincil bir eğitim sürecinden geçirip özelleştirme imkanına da sahibiz.
Daha düşük maliyet, daha düşük bir karbon ayak izi ve kendi sistemlerimizin güvenliğinde amacımıza uygun Yapay Zekalara sahip olmak artık elimizde. Ve bir Yapay Zekada durmamıza da hiç gerek yok. Farklı amaçlar için farklı boyutlarda, farklı güçlü yönlere sahip çeşit çeşit Yapay Zekayı seçme verilerle sırf kendi amacımız için eğitebiliriz.
Peki bu doğru yaklaşım mı? Piyasa öncüsü şirketlerin en gelişmiş modelleri gerçekten çok güçlü. Büyük bir genel bilgi altyapısına sahipler ve önceden görülmemiş durumlarla çoğunlukla daha iyi başa çıkıyorlar. Multimodality denen farklı tür girdileri işleme kabiliyetine de sahipler. Resim, yazı, ses gibi farklı tür girdileri işleyebiliyorlar. Bu olanaklar elimizin altındayken kendi çözümlerimizi üretmeye çalışmak verimsiz bir yaklaşım mı?
Cevap son derece öznel. Kurum içi modeller şüphesiz daha çok emek gerektiriyor hem geliştirilmeleri hem kullanımları açısından. Dışa bağımlılığı azaltmaları, çeşitli zorluklarının üstesinden gelebilecek bir takımın varlığında oldukça cezbedici olabilir. Özel bir alan için geliştirilmiş küçük modellerin GPT-4 gibi modellerin performansını geçebildiği net bir şekilde kanıtlanmıştır. Farklı girdi türleri için de farklı modeller kullanmanın faydası var. Bir görüntü işleme görevi için bu çok büyük modellerden birinin kullanımı yerine sadece görüntüyle çalışan bir model hem doğruluk oranı hem de hız açısından büyük üstünlük sağlayabilir. GPT-4’ün 1 trilyonun üstünde parametresi olduğu tahmin ediliyor ama bir YOLO (You Only Look Once) görüntü modeli (orta boy) 22 milyon parametre ile bile oldukça güzel sonuçlar veriyor. BERT dil modeli ise 110 milyon parametreye sahip, günümüz standartlarında oldukça küçük bir model. Üretme fonksiyonuna sahip değil ama duygu analizi, sınıflandırma, kişi ya da yer tanıma ve gramer etiketleme gibi görevlerde oldukça başarılı ve hala akademik çalışmalarda kullanılan bir model.
Yapay Zeka seçimi tamamen amacımıza, imkanlarımıza ve ne kadar emek harcamaya hazır olduğumuza bağlı bir durum. Önceliklerimiz en büyük belirleyici faktörlerden biri. Ama gelişmeleri yakından takip etmek ve amacımıza en iyi hizmet edecek çözümlere ilk ulaşmak yapay zeka alanında başarının anahtarıdır.
Tek Bir Büyük Yapay Zeka mı? Küçük Yapay Zekalar Takımı mı?
Tarih
Bu yazıdan şunu anlıyorum: İhtiyaç doğrultusunda araba kullanmak gibi bir şey. Şehir içinde küçük, yakıt tüketimi az bir araba kullanmak veya bir grubu taşırken otobüs kullanmak gibi.
Yazı için teşekkür ederim.