Yapay zeka tarafından oluşturulan videolarda tutarlılık elde etmek her zaman zor olmuştur. Sanal modeller ve kıyafetler üretmek basit olsa da, Elon Musk'ın bir kürk mantoyu modellediği bir video oluşturmak karmaşık bir görev olmaya devam ediyor.
Pika'nın yakın zamanda güncellenen 2.0 modeli akıllıca bir çözüm sunuyor: Pika, birden fazla fotoğraf yükleyerek belirli öğelere atıfta bulunarak olağanüstü doğrulukta videolar üretebiliyor.
Kullanıcılar, kişilerin, ürünlerin ve mekanların fotoğraflarını sağlayarak görsellerin orijinal görüntülerle yakından uyuştuğu basit bir ticari video oluşturabilirler.
Bu, AI'nın video tutarlılığını çözdüğü ve reklamverenler için yeni zorluklar yarattığı anlamına mı geliyor? Tam olarak değil. Pika'nın kullanımı eğlenceli olsa da, pratikliği hala geliştirilmeye açık.
Pika ile Gerçek Dışı Sahneler Yaratmak
Pika'nın "Sahne Bileşenleri" adı verilen çoklu resim giriş özelliği, kullanıcıların fotoğrafları birleştirmesine ve benzersiz senaryolar oluşturmasına olanak tanır. İşte nasıl çalıştığı:
- “+” butonuna tıklayarak en fazla altı adet görsel yükleyin.
- Metin kutusuna basit bir komut ekleyin.
Örneğin, Elon Musk ve Ultraman'ın birlikte bir film izlemesini sağlayalım. Komut: İki kişi karanlık bir sinemada oturuyor, ellerinde patlamış mısır tutuyor ve beklentiyle ekrana odaklanıyor...
Fotoğraflarını yüklemeniz yeterli ve tiyatro ortamı komuttan yaratılır. Elon Musk gerçekçi görünse de Ultraman'in görünümü abartılı ve orijinal fotoğraftan kopuk hissettiriyor.
Pika'nın öne çıkan bir özelliği, öğeleri "yeniden kullanabilme" yeteneğidir. Örneğin, Musk ve Ultraman'ı uyumlu yeşil paltolarla giydirebilir ve bir moda fotoğraf çekimi oluşturabiliriz.
İki kişinin fotoğrafları da hazır görsellerden kaynaklandı. Yeşil palto ve buzlu karlı arka plan, AI kullanılarak ayrı ayrı oluşturuldu ve paltodaki “AIGC” yazısı Pika için bir meydan okuma görevi gördü.
Sonuç sahne ve palto arasında iyi bir tutarlılık gösterdi ve "AIGC" yazısı hafifçe tanınabilirdi. Modellerin pozları da talimatlara uyuyordu. Ancak en büyük sorun şu ki, bu iki kişi kim? Videodaki ve fotoğraflardaki yüzler aynı olmayabilir, ancak tamamen alakasızlar.
Daha sonra Pika'nın kıyafet özelleştirmesini, "Ben insandım" ifadesinin yazılı olduğu siyah bir tişört üreterek test ettik. Müzikal bir performans yaratmak için Mark Zuckerberg'in bir fotoğrafını ve bir ukulele fotoğrafını ekledik.
Pika istemi iyi takip etti ve kamera hareketi akıcıydı. Giysiler de kusursuz bir şekilde giyildi, ancak sağ el, özellikle başparmak, hala mükemmel değil.
Google Veo ve OpenAI Sora ile karşılaştırıldığında, Pika'nın modeli birinci sınıf değil. Bir sorunu çözmek genellikle daha fazla hata ortaya çıkarır.
Gerçekçi bir stil denedikten sonra anime stiline geçelim. Gintoki Sakata ve Naruto Uzumaki'yi aynı karede görmek için arka planda mavi gökyüzü ve beyaz bulutlar olan iki resim seçtim.
Arka plan doğal bir şekilde harmanlanıyor ve ifadeler iyi yakalanmış, saç ve kıyafetlerdeki rüzgar efekti güzelce oturuyor. Ancak, dönme efekti oldukça rahatsız edici. Gintoki'nin gözleri cansız görünüyor, gerçekten geriye doğru kaymıyor.
Ünlü resimlerin çağlar arasında etkileşime girmesini de sağlayabilirsiniz; örneğin Mona Lisa ve İnci Küpeli Kız'ın McDonald's'ta patates kızartması yemesi gibi. Etkisi ideal değil. Mona Lisa'yı görünce insan acaba Da Vinci mezarında ters mi döner diye düşünüyor. Karakterler videoya yerleştirilmiş çıkartmalara benziyor, tuhaf baş hareketleri var.
Bazen sadeliğe geri dönmek beklenmedik derecede iyi sonuçlar doğurur. Bir Starbucks görseli ve bir Monet'nin Nilüferleri tablosunun yüklenmesi "lotus benzeri" bir kahve fincanıyla sonuçlanır.
Çin yapımı modellerle rekabet ederken, yapay zeka videosunu kontrol etmek artık daha kolay
Bir dereceye kadar, Pika video kontrol edilebilirliğini iyileştirdi. Uygulamada görüldüğü gibi, tamamen başarılı olmasa da Pika sahnelerde, kıyafetlerde ve nesnelerde tutarlılığı koruyor, ancak yüzler stilden bağımsız olarak bozulmaya meyilli.
Ek olarak, Pika'nın temel yeteneklerinin geliştirilmesi gerekiyor. Yemek yemek veya piyano çalmak gibi eylemler hala zorluklar yaratıyor. Bu sorunlar kart çekerek giderilebilir mi?
Üç kelimeyle: uygun fiyatlı değil. Pika 2.0 şu anda yalnızca Pro ve Fancy kullanıcıları için mevcut ve ücretsiz deneme olmadan ayda en az 35 dolara mal oluyor. Dahası, Pro kullanıcıları ayda yalnızca 2000 puan alıyor ancak Sahne Malzemeleri özelliğini kullanmak video başına 100 puana mal oluyor.
Aslında Çin yapımı AI video modeli Vidu, "çoklu görüntü referansı" özelliğini Pika'dan daha önce uyguladı. Kullanıcılara daha çekici gelen şey, ücretsiz deneme noktaları sunmasıdır.
Pika'nın bazı kasalarını Vidu'da test ettim. Patates kızartması yiyen Mona Lisa ve İnci Küpeli Kız sanki yerden yeni çıkmış gibi görünüyorlar, ama Mona Lisa'nın benzerliği Pika'nınkinden daha iyi.
Elon Musk ve Ultraman birlikte film izliyor, Musk'ın yüzü %70-80 oranında doğru görünüyor, ancak Ultraman'ın yüzü hala pek iyi değil.
Gintoki Sakata ve Naruto Uzumaki aynı karede, Vidu ön yüzden yan yüz üretebiliyor ancak stil orijinal görüntüden farklı.
Ayrıca, Vidu'nun Pika'ya kıyasla bir sınırlaması var: En fazla üç resim yükleyebilir. Bu yüzden, Musk ve Ultraman için bir moda çekimi oluşturmak için Vidu'yu kullandığımda, sadece fotoğraflarını ve yeşil bir paltoyu yükledim ve arka planı dışarıda bıraktım.
Sonuçlar alışılmadık geldi. Yüz stabilitesini korumanın hala bir zorluk olduğu açık.
Vidu ile Pika'yı karşılaştırırken, görüşler değişebilir. Pika profesyonel bir sürüm kullanırken, Vidu bazı farklılıkları açıklayan ücretsiz bir sürüm kullanır. Ancak, Pika ve Vidu'nun yaklaşımı benzerdir—nispeten sabit nesneler üretmek için sadece birkaç resim materyali ve basit istemler kullanır.
Yapay zeka video üretiminde, konu tutarlılığını korumak şu anda LoRA çözümüyle daha güvenilir bir şekilde elde ediliyor. Bu, modelin belirli miktarda belirli konu materyaliyle ince ayarlanmasını içerir. Yeterli materyal ve eğitimle, model karakterin görünüm özelliklerini kademeli olarak öğrenir.
Ancak AI videolarını daha erişilebilir ve ticari olarak değerli kılmak için giriş engelinin düşürülmesi gerekiyor. En azından Vidu ve Pika ile potansiyeli görüyoruz.
Yapay Zeka Kısa Videolarıyla Viral Olmak: Yaratıcılığa Giden Tek Yönlü Bilet
Pika'nın 2.0 modelinin piyasaya sürülmesinden kısa bir süre sonra, uluslararası kullanıcılar çoktan eğlenmeye başlamıştı. Kendi fotoğraflarını kullanarak farklı sahnelerde tekrar tekrar video üreterek "anında evren seyahati" elde edebiliyorlardı. Yapay zeka ile kıyafetleri denemek sadece bir tık uzağınızda. Modeller ve kıyafetler kusursuz bir şekilde akıyor ve gerçek çekimlerin maliyetinden tasarruf sağlıyor.
Pika ile oynamak bana sanki "QQ Show" ve "The Sims" oynuyormuşuz gibi bir his verdi; videodaki karakterleri nasıl giydireceğimize karar veriyorduk.
Musk'ın "rüyasını" gerçekleştirmek istiyorsanız, bu kolay. İlk olarak, diğer AI araçlarını kullanarak bir "Mars'ı Fethet" tişörtü ve üzerinde "MAGA" yazan kırmızı bir şapka oluşturun.
Daha sonra bu görselleri, Mars manzarasını, Musk'ın fotoğrafını, Optimus Prime insansı robotunu ve en sevdiği internet memesi Doge prototipini Pika'ya yükleyin.
Sonunda, solda bir köpek ve sağda bir robotla, dost canlısı görünen ama Musk'a pek benzemeyen, güneşli ve neşeli bir genç adam beliriyor.
Ona benzeyip benzemediği bir şey; açık fikirli olduğunuz sürece olasılıklar sonsuzdur. Kendimizin ve ünlülerin fotoğraflarını kullanarak kolayca hayranlığa katılabiliriz. Baştan ayağa kendimizi giydirmek için şapkalar, kıyafetler ve enstrümanlar yükleyin. Sahneleri, ürünleri ve modelleri toplayın ve basit bir reklam videonuz olsun…
Fotoğraflar + AI görüntüleri + Pika 2.0 + istemler birçok ilgi çekici görsel üretebilir. Bu yöntem ayrıca, görüntü modelleriyle çözülebilen yazı gibi video modellerinin bazı eksikliklerinden de kaçınır. Google'ın model yetenekleriyle doğrudan rekabet etmeden veya Runway'in Hollywood hayalleriyle karşılaştırmadan, Pika'nın kendine özgü bir yaklaşımı vardır.
Pika, daha önce yayınladığı Pikaffect adlı yapay zeka özel efekt özellikleriyle RedNote ve TikTok gibi platformlarda viral hale gelerek kullanıcı tabanını 11 milyonun üzerine çıkarmış, yaratıcılığın her zaman ustası olmuştu.
Pika, eğlenceli kısa videolara olan talebi yüksek olan bir kullanıcı grubuna ulaştı. Bu videolar şablonlu ve geçici olsa bile, eğlenceli oldukları sürece insanlar onlara akın edecektir.
Kazanmanın her şeyi almakla ilgili olduğunu kim söyledi? Yapay zeka pazarı çok geniş ve fiziksel dünyayı simüle etmek büyük bir hayal olsa da, yapay zeka kısa videolarını eğlenceli hale getirme gibi küçük bir hedefe ulaşmak da bir başarı biçimidir.
Kaynaktan ifan
Yasal Uyarı: Yukarıda belirtilen bilgiler Chovm.com'dan bağımsız olarak ifanr.com tarafından sağlanmaktadır. Chovm.com, satıcının ve ürünlerin kalitesi ve güvenilirliği konusunda hiçbir beyan ve garanti vermez. Chovm.com, içeriğin telif hakkıyla ilgili ihlallere ilişkin her türlü sorumluluğu açıkça reddeder.