Microsoft, VASA-1 adını taşıyan yeni bir yapay zeka aracını tanıttı. Bu araç, doğrudan hareketsiz görüntülerden insan yüzlerinin videolarını oluşturabiliyor ve ayrıca bir ses klibi sağlandığında yüz ifadelerini de senkronize edebiliyor.
Şirket, resmi web sitesinde VASA-1’in çeşitli örneklerini sergileyerek yapay zeka meraklılarını etkiledi.
Microsoft geliştirdiği VASA-1, şirketin insan yüz ifadeleri etrafında özel olarak küratörlüğünü yaptığı üst düzey bir yapay zeka olarak bizleri karşılıyor. Yüz dinamikleri yoluyla geniş bir duygu ve duygu yelpazesi oluşturabilir ve yüz kaslarının, dudakların, burnun, başın eğilmesinin ve diğer birçok faktörün hareketlerini içeriyor.
Microsoft, VASA-1’den oluşturulan videolardan bazı örnekleri resmi web sitesinde paylaştı.
Microsoft just introduced VASA-1.
It can generate photorealistic talking videos using just one photo and an audio file.
6 wild examples and demo below: pic.twitter.com/z4YIq4jYRx
— Eyisha Zyer ???? (@eyishazyer) April 18, 2024
Microsoft’un VASA-1’i, şu anda maksimum 512×512 piksel çözünürlükte ve 40 fps hızında videolar üretebiliyor. Şirket, bu aracın gerçek hayata mümkün olduğunca yakın videolar oluşturmak için tasarlandığını belirtiyor. Şirket, VASA-1’in kötüye kullanılma potansiyeli nedeniyle bu teknolojiyi halka açık olarak yayınlamayacağını açıkladı.
VASA-1’in konsepti, OpenAI’nin Sora‘sına benzer. Her iki araç da yapay zeka kullanarak gerçekçi görünümlü videolar oluşturuyor. VASA-1 insan ifadelerine odaklanırken, Sora bağlamsal arka planlar ve yapay öğelerle karmaşık videolar oluşturabiliyor.
Ancak, her iki araç da henüz kamuya açıklanmadı. Microsoft ve OpenAI’nin resmi duyuruları, VASA-1 ve Sora’nın CGI’daki ve yapay zeka tarafından oluşturulan gerçekçi insan avatarlarındaki yeteneklerini ve potansiyel uygulamalarını vurguluyor.