Dünya, OpenAI’ın yeni yapay zekâ modeli Sora’nın çıkışını heyecanla beklerken, Çin’de TikTok’un rakibi olan Kuaishou, piyasaya güçlü bir adım attı.
Kuaishou’nun geliştirdiği ve Kling adını verdiği bu açık erişimli yapay zekâ modeli, ürettiği videolarla büyük bir ilgi topladı. İlk incelemelere göre, Kling’in performansı Sora’yı geride bırakacak gibi görünüyor.
Kling’in gerçek dünyayı simüle etme yeteneği o kadar güçlü ki, gerçek ve yapay videoları ayırt etmek için kullanılan yöntemlerin yeniden değerlendirilmesi gerekebilir.
Kling, basit metin istemlerine yanıt olarak 1080p kalitesinde, 30 fps hızında ve 2 dakika uzunluğunda videolar üretebiliyor. En dikkat çekici özelliklerinden biri, fiziksel dünyanın detaylarını son derece doğru bir şekilde yansıtabilmesi. Öte yandan, Sora çeşitli boyut ve çözünürlüklerde videolar oluşturabilse de, üretebildiği videoların süresi 60 saniye ile sınırlı kalıyor.
Kling’in teknolojik üstünlüğü, Difüzyon Transformatörü mimarisini kullanmasından kaynaklanıyor. Bu model, tescilli 3B VAE (Variational Auto Encoder) ve değişken çözünürlük eğitimi sayesinde geniş bir en-boy oranı desteği sunuyor. Ayrıca Kling, tek bir tam vücut fotoğrafından tam ifade ve uzuv hareketi üretebilen gelişmiş 3B yüz ve vücut yeniden yapılandırma teknolojisine sahip.
Sora by OpenAI is insane.
But KWAI just dropped a Sora-like model called KLING, and people are going crazy over it.
Here are 10 wild examples you don't want to miss:
1. A Chinese man sits at a table and eats noodles with chopstickspic.twitter.com/MIV5IP3fyQ
— Angry Tom (@AngryTomtweets) June 6, 2024
Örnek olarak, Kling “Çinli bir adam masada oturuyor ve yemek çubuklarıyla erişte yiyor” istemiyle gerçekçi bir video üretebiliyor.
Çin, yapay zekâ modelleri geliştirme konusunda hızla öne geçiyor. Açık erişimli olarak piyasaya sürülen Kling’in ürettiği örnek videolar, bu modelin yeteneklerini gözler önüne seriyor.
OpenAI ise Sora’yı yıl sonuna kadar piyasaya sürmeyi planlıyor, ancak Çin’in hızla gelişen video üretim teknolojilerine yetişmekte zorlanabiliyor. OpenAI’ın avantaj sağlayabileceği tek nokta, Çin’in bu modelleri dünya genelinde erişime sunmama olasılığı olabilir.
Kling, Çin’in metinden video üreten ilk modeli değil. Nisan ayında tanıtılan Vidu AI, 1080p çözünürlükte ve 16 saniyelik videolar üreterek Sora’ya meydan okuyan ilk Çin yapımı model olmuştu.
Kling ile hazırlanmış diğer örnek videoları aşağıdaki tweet zincirinde görebilirsiniz.
4. A white cat driving in a car through a busy downtown street with tall buildings and pedestrians in the backgroundpic.twitter.com/VG9dp6zRaj
— Angry Tom (@AngryTomtweets) June 6, 2024
10. An astronaut runs on the surface of the moon, the low angle shot shows the vast background of the moon, the movement is smooth and appears lightweightpic.twitter.com/rqPG1P9b1u
— Angry Tom (@AngryTomtweets) June 6, 2024
8. Car mirrors and sunsetspic.twitter.com/i1KaIRPDV7
— Angry Tom (@AngryTomtweets) June 6, 2024