Meta CEO Mark Zuckerberg Cuma günü yaptığı açıklamada, yeni bir dil modeli geliştirdiğini ve yakında yayınlayacağını duyurdu.
LLaMA adı verilen model, bilim insanlarının ve mühendislerin soruları yanıtlama ve belgeleri özetleme gibi yapay zeka uygulamalarını keşfetmelerine yardımcı olmayı amaçlıyor.
Meta’nın Fundamental AI Research (FAIR) ekibi tarafından geliştirilen yeni modelini piyasaya sürmesi, büyük teknoloji şirketlerinin ve iyi sermayeli startup’ların yapay zeka tekniklerindeki ilerlemeleri duyurmak ve teknolojiyi ticari ürünlere entegre etmek için yarıştığı bir dönemde geldi.
Bilindiği üzere büyük dil modelleri , OpenAI ChatGPT , Microsoft gibi uygulamaların temelini oluşturuyor.
Zuckerberg yaptığı paylaşımda, LLM teknolojisinin sonunda matematik problemlerini çözebileceğini veya bilimsel araştırma yapabileceğini söyledi.
Ayrıca LLM’lerin metin oluşturma, sohbet etme, yazılı materyali özetleme ve matematik teoremlerini çözme veya protein yapılarını tahmin etme gibi daha karmaşık görevlerde çok fazla umut vaat ettiğini ekledi.
Bu arada Meta, LLM’nin çeşitli şekillerde rakip modellerden ayrıldığını söylüyor.
İlk olarak modelin, 7 milyar parametreden 65 milyar parametreye kadar çeşitli boyutlarda geleceğini söylüyor. Daha büyük modeller, son yıllarda teknolojinin kapasitesini genişletmede başarılı oldu. Ancak bunların çalıştırılması daha pahalıya mal oldu. Bu, araştırmacıların ”çıkarım” dediği bir aşama.
Örneğin, OpenAI’nin Chat-GPT 3′ü 175 milyar parametreye sahip.
Meta ayrıca modellerini araştırma kamuoyunun kullanımına sunacağını ve araştırmacılardan başvuru aldığını söyledi. Rakipleri olan Google’ın LaMDA’sı ve OpenAI’nin ChatGPT’sinin altında yatan modellerin herkese açık olmadığını belirtmekte fayda var.
Zuckerberg ayrıca Meta’nın, bu açık araştırma modeline kendini adadığını ve yeni modellerini yapay zeka araştırma topluluğunun kullanımına sunacağını vurguladı.