Birkaç ay önce, Wall Street’in üretken yapay zekaya yaptığı büyük bahis, DeepSeek sahneye çıktığında hesaplaşma anı yaşadı.
Ağır sansürlü yapısına rağmen, açık kaynaklı DeepSeek, sınır ötesi bir akıl yürütme yapay zeka modelinin mutlaka milyarlarca dolar gerektirmediğini ve mütevazı kaynaklarla gerçekleştirilebileceğini kanıtladı.
Huawei, Oppo ve Vivo gibi devler tarafından hızla ticari olarak benimsenirken, Microsoft, Alibaba ve Tencent gibi şirketler de platformlarında hızla yer verdi.
Şimdi, bu popüler Çinli şirketin bir sonraki hedefi, kendilerini geliştirmek için döngüsel bir yargıç-ödül yaklaşımı kullanan kendini geliştiren yapay zeka modelleri…
Ön baskı bir makalede DeepSeek ve Çin’in Tsinghua Üniversitesi’ndeki araştırmacılar, yapay zeka modellerini kendi kendini geliştiren bir şekilde daha akıllı ve verimli hale getirebilecek yeni bir yaklaşımı açıklıyor.
Altta yatan teknoloji, öz-ilkeli eleştiri ayarlama (SPCT) olarak adlandırılıyor ve yaklaşım teknik olarak üretken ödül modellemesi (GRM) olarak biliniyor.
İlginizi Çekebilir: ChatGPT’nin görüntü oluşturma özelliği artık ücretsiz
Uzmanlar, kendi kendini geliştiren yeni nesil AI modellerine DeepSeek-GRM adını veriyor
En basit haliyle belirtelim ki, gerçek zamanlı bir geri bildirim döngüsü oluşturmaya benziyor. Bir AI modeli, eğitim sırasında modelin boyutunun ölçeklendirilmesiyle temelde iyileştiriliyor.
Bu, çok fazla insan emeği ve bilgi işlem kaynağı gerektiriyor. DeepSeek, altta yatan “yargıcın”, kullanıcı sorgularına bir yanıt hazırlarken bir AI modeli için kendi eleştiri ve ilke setiyle geldiği bir sistem öneriyor.
Bu eleştiri ve ilkeler seti daha sonra bir AI modelinin kalbinde belirlenen statik kurallarla ve istenen sonuçla karşılaştırılıyor.
Yüksek derecede bir eşleşme varsa, AI’nın bir sonraki döngüde daha iyi performans göstermesi için etkili bir şekilde yönlendiren bir ödül sinyali üretiliyor.
Makalenin arkasındaki uzmanlar, kendi kendini geliştiren yeni nesil AI modellerine DeepSeek-GRM adını veriyor.
Makalede listelenen kıyaslamalar, bu modellerin Google’ın Gemini, Meta’nın Llama ve OpenAI’nin GPT-4o modellerinden daha iyi performans gösterdiğini öne sürüyor. DeepSeek, bu yeni nesil AI modellerinin açık kaynak kanalı aracılığıyla yayınlanacağını söylüyor.