SOSYAL MEDYA HESAPLARIMIZ

MOBİL UYGULAMALARIMIZ

HaberTekno

Paylaş
veya
aşağıdaki bağlantıyı paylaşın:
Anasayfa » Teknoloji » ChatGPT ve DeepSeek’in artık yeni bir rakibi var: QwQ-32b

ChatGPT ve DeepSeek’in artık yeni bir rakibi var: QwQ-32b

Yayınlanma:
ChatGPT ve DeepSeek’in artık yeni bir rakibi var: QwQ-32b

ChatGPT ve DeepSeek’in artık yeni bir rakibi var: QwQ-32b. Evet Alibaba son akıl yürütme modelini yeni duyurdu.

DeepSeek ve OpenAI’nin endişelenecek bir şeyleri olabilir gibi görünüyor. En azından Alibaba’nın tüm vaatleri doğru çıkarsa.

Açık kaynaklı. Ücretsiz olarak da deneyebilirsiniz. Ancak şaşırtıcı olmayan bir şekilde, sizinle konuşmayacağı bazı şeyler olduğunu göreceksiniz.

QwQ-32b (Quan-with-Questions) adı verilen yeni model çok daha az parametreyle çalışıyor. Yani daha az kaynak gerektiriyor; ancak Alibaba, bu modelin DeepSeek veya OpenAI’nin o1-mini modeliyle aynı seviyede performans gösterdiğini iddia ediyor.

İlginizi Çekebilir: Robot köpek Sparky: Küçük, güçlü ve özelleştirilebilir

DeepSeek’in R1 büyük dil modeli (LLM),aniden ChatGPT ve diğer alternatiflerin belirlediği altın standartla rekabet edebilecek duruma gelmişti

DeepSeek‘in R1 büyük dil modeli (LLM), Şubat ayının başlarında piyasaya sürüldüğünde çok popülerdi ve aniden ChatGPT ve diğer alternatiflerin belirlediği altın standartla rekabet edebilecek duruma geldi.

DeepSeek-R1’in çalışması için 671 milyar parametre gerekiyor ve bunların 37 milyarı etkinleştiriliyor. Bu arada, Alibaba’nın yeni QwQ-32b’si 32 milyar parametreyle idare edebiliyor.

Bu sayılar birçok kişi için tamamen soyut, ancak işlem gücünde büyük bir fark var; DeepSeek R1’in çalışması için 1600 GB VRAM gerekirken, QwQ-32b yalnızca 24 GB VRAM ile idare edebiliyor.

ChatGPT-ve-DeepSeek'in-artık-yeni-bir-rakibi-var:-QwQ-32b

Çoğu durumda, bu Nvidia’nın H100 veya eşdeğerleri anlamına geliyor ancak oyun odaklı RTX 4090 bile 24 GB’a sahip. En son RTX 5090 bunu 32 GB’a çıkarıyor.

Alibaba’nın QwQ-32b’si Apache 2.0 lisansı altında mevcut. Yani şirketler ve araştırmacılar bunu kullanabilir. Daha da önemlisi, Alibaba’nın Qwen Chat’ini deneyerek kullanabiliriz. DeepSeek gibi, bazı sınırlamaları var ancak avantajları da var.

Hızlı, basit sorulara bile oldukça derinlemesine yanıtlar veriyor gibi görünüyor. Bu iyi olabilir ancak bir bakıma can sıkıcı da olabilir çünkü istemediğiniz birçok gereksiz bağlam sunuyor.

Alibaba’nın iddialarının doğru çıkıp çıkmayacağı henüz belli değil ancak ChatGPT ve DeepSeek’in artık yeni bir rakibi var gibi görünüyor.

İlgili Haberler