DeepSeek, GPT-4o’yu solladı

Birkaç ay önce, Wall Street’in üretken yapay zekaya yaptığı büyük bahis, DeepSeek sahneye çıktığında hesaplaşma anı yaşadı.

Ağır sansürlü yapısına rağmen, açık kaynaklı DeepSeek, sınır ötesi bir akıl yürütme yapay zeka modelinin mutlaka milyarlarca dolar gerektirmediğini ve mütevazı kaynaklarla gerçekleştirilebileceğini kanıtladı.

Huawei, Oppo ve Vivo gibi devler tarafından hızla ticari olarak benimsenirken, Microsoft, Alibaba ve Tencent gibi şirketler de platformlarında hızla yer verdi.

Şimdi, bu popüler Çinli şirketin bir sonraki hedefi, kendilerini geliştirmek için döngüsel bir yargıç-ödül yaklaşımı kullanan kendini geliştiren yapay zeka modelleri…

Ön baskı bir makalede DeepSeek ve Çin’in Tsinghua Üniversitesi’ndeki araştırmacılar, yapay zeka modellerini kendi kendini geliştiren bir şekilde daha akıllı ve verimli hale getirebilecek yeni bir yaklaşımı açıklıyor.

Altta yatan teknoloji, öz-ilkeli eleştiri ayarlama (SPCT) olarak adlandırılıyor ve yaklaşım teknik olarak üretken ödül modellemesi (GRM) olarak biliniyor.

İlginizi Çekebilir: ChatGPT’nin görüntü oluşturma özelliği artık ücretsiz

Uzmanlar, kendi kendini geliştiren yeni nesil AI modellerine DeepSeek-GRM adını veriyor

En basit haliyle belirtelim ki, gerçek zamanlı bir geri bildirim döngüsü oluşturmaya benziyor. Bir AI modeli, eğitim sırasında modelin boyutunun ölçeklendirilmesiyle temelde iyileştiriliyor.

Bu, çok fazla insan emeği ve bilgi işlem kaynağı gerektiriyor. DeepSeek, altta yatan “yargıcın”, kullanıcı sorgularına bir yanıt hazırlarken bir AI modeli için kendi eleştiri ve ilke setiyle geldiği bir sistem öneriyor.

Bu eleştiri ve ilkeler seti daha sonra bir AI modelinin kalbinde belirlenen statik kurallarla ve istenen sonuçla karşılaştırılıyor.

Yüksek derecede bir eşleşme varsa, AI’nın bir sonraki döngüde daha iyi performans göstermesi için etkili bir şekilde yönlendiren bir ödül sinyali üretiliyor.

Makalenin arkasındaki uzmanlar, kendi kendini geliştiren yeni nesil AI modellerine DeepSeek-GRM adını veriyor.

Makalede listelenen kıyaslamalar, bu modellerin Google’ın Gemini, Meta’nın Llama ve OpenAI’nin GPT-4o modellerinden daha iyi performans gösterdiğini öne sürüyor. DeepSeek, bu yeni nesil AI modellerinin açık kaynak kanalı aracılığıyla yayınlanacağını söylüyor.

DeepSeek, GPT-4o’yu solladı

Samsung, One UI 7 güncellemesini dağıtmaya başladı: İşte ilk aşamada güncellemeyi alacak ülkeler

Ulukurt, 12 bin 500 yıl sonra yeniden hayata döndürüldü!

BENZER HABERLER

DeepSeek’ten sonra Manus: Çin’in çok konuşulan yeni yapay zekası

ChatGPT ve DeepSeek’in artık yeni bir rakibi var: QwQ-32b

ABD’de DeepSeek indirmek suç sayılabilir

DeepSeek R1’in güvenlik zafiyeti: Hackerlar için açık kapı mı?

Bir yanıt yazın Yanıtı iptal et

BAŞLICA HABERLER

Türkiye’de Üretilen İlk Katlanabilir Telefonlardan Reeder S71 Flip Duyuruldu

Xiaomi Tag Lansmana Hazır: Uygun Fiyatlı, Güçlü Gizlilikli Akıllı Takip Cihazı Yolda!

Çin, Bilim Kurgu Filmlerini Aratmayan Fütüristik Uzay Platformu “Luanniao”yu Tanıttı

Facebook Yüz Tanıma Nedir, Nasıl Aktif Edilir? (Yeni Özellik)

En Tehlikeli Android Mesajlaşma Uygulamaları Belli Oldu

Facebook, Türkiye’nin En Sık Kullandığı Emojileri Paylaştı

Tinder rehberde bulunan kişileri görme özelliğine son veriyor

Facebook Yüz Tanıma Nedir, Nasıl Aktif Edilir? (Yeni Özellik)

Fotoğraf Boyutu Küçültme İşlemi Nasıl Yapılır Detaylı Anlatım

Gezegen avlamak ne anlama geliyor? İşte son araştırma sonuçları

iPadOS nedir ve özellikleri hakkında bilinmesi gereken detaylar

Wildermyth Sistem Gereksinimleri Kaç GB? (2021)