Amatör bir film yapımcısının yapay zeka projesi sıradan kısa filmler arasında nasıl öne çıktı?
Şubat 2023'te oyun sektöründe programcı olan Jim, yapay zeka sanatçısı oldu.
Aralık 2024'te Jim'in yapay zeka animasyon kısa filmi "The Thin Man The Gun The Hotpot" Bağımsız Kısa Film Ödülleri'nde En İyi Animasyon Kısa Film Altın Ödülü'nü kazandı.
Bu, bağımsız film dünyasında önemli bir uluslararası kısa film festivali, özellikle AI çalışmaları için değil, bu da Jim için büyük bir başarı. "Jüri üyelerinin AI etiketini görmezden gelerek hikayenin kendisine odaklanması memnuniyet verici." dedi.
“The Thin Man The Gun The Hotpot” esas olarak Jim tarafından tek başına tamamlandı. 10 dakikalık film 242 çekimden oluşuyor, yapımı neredeyse üç ay sürdü ve günde ortalama iki saatten fazla olmak üzere en az 200 saatlik çalışma gerektirdi.
90 günlük yaratım süreci boyunca Jim, yapay zekayla bir akıl savaşında olduğunu, sınırlarını zorladığını ve kısıtlamalarından kaçındığını hissetti. İzleyiciler, "Yapay zeka animasyonlar yapmaya başladı," dediğinde Jim, "Yapay zekayı animasyonlar yapmaya iten yaratıcılar," diye yanıtladı.
3 Ay, 10 Dakika
“The Thin Man The Gun The Hotpot”, Çin kültürüne dayanan bir hikayesi olan, Hollywood'un geçmişinde önemli bir tür olan bir kara suç filmidir. “The Thin Man The Gun The Hotpot” terimi, gece geç saatlerde açık olan küçük yiyecek tezgahlarını ifade eden Güneybatı Çin'den gelmektedir.
Ana karakter Xu Xia, gece geç saatlerde bir sokak tezgahında yemek yiyen genç bir adamdır. Babasının tıbbi tedavisini ödemek için etik olmayan seçimler yapar ancak dokunulmaz bir ahlaki çizgiyi korur. Sonunda şiddet ve cinayete bulaşır, kaderin tuzağına düşer.
"Yapay zeka animasyonu" demektense, "The Thin Man The Gun The Hotpot"un yapay zeka araçları kullanılarak yapılmış bir animasyon olduğunu söylemek daha doğru olur.
AI görselleri oluştururken, senaryo, düzenleme, seslendirme, müzik ve ses efektleri gibi diğer unsurlar manuel olarak yapıldı. Görsellerdeki metinler post prodüksiyonda eklendi.
Görseller açısından Jim, "saf AI jenerasyonu" tarzını takip ediyor. "The Thin Man The Gun The Hotpot" canlı aksiyon görüntüleri içermiyor; görüntü-video dönüşümüne dayanıyor. Görüntüler Midjourney tarafından, videolar ise Keling, Pika, Jidream, PixVerse ve Runway tarafından oluşturuldu.
Yapay zeka üretimi öngörülemezdir, ancak yapay zeka ile tutarlı bir hikaye anlatmak istikrar gerektirir. Karakter tasarımından, Jim karakter tutarlılığının nasıl korunacağını düşündü.
Jim'in karakter tasarımı için iki ilkesi vardı. Birincisi, genel görünüm basit olmalı, birkaç anahtar sözcükle tanımlanabilir olmalı. İkincisi, karakterlerin ayırt edici unsurları olmalı, böylece tamamen tutarlı olmasalar bile izleyici tarafından tanınabilir kalmalılar.
En temsili karakterler Kardeş Wan ve Li Jiajia'dır. Kardeş Wan keldir, spor kıyafetleri ve güneş gözlüğü takar; Li Jiajia ise dalgalı saçları ve kırmızı kıyafetleriyle 90'ların retro kadınını andırır.
Gözlük ve takım elbise giyen, sakal bırakmayan, görünüşte zarif Bay Zhu, sıra dışı hiçbir özelliğe sahip olmayışı nedeniyle Jim'in en çok tekrarladığı karakterdir.
Jim, yapay zekanın "eski zengin" aurasına sahip karakterleri kolayca ürettiğini, ancak zengin ama seçkin olmayan, tehlikeli ama suç örgütü lideri olmayan Bay Zhu gibi karakterlerle başa çıkmakta zorlandığını keşfetti.
Jim animasyon stilini "Animasyon filtreli canlı aksiyon filmi" olarak tanımlıyor. İzleyiciler gerçek oyuncularla nasıl görüneceğini hayal edebilir.
Her karakterin görüntüsü metin aracılığıyla üretildiğinde, bir filmin kostüm fotoğrafına sahip olmak gibi oluyor. Jim daha sonra bu görüntüleri materyal olarak kullanıyor ve karakterleri değiştirmeden farklı açılar ve sahnelerle daha fazla görüntü üretiyor.
Yeterli sayıda görselle videolar üretilebilir. Yapay zeka video araçları hızla güncellenir; “The Thin Man The Gun The Hotpot” Ağustos-Eylül 2024 arasındaki sürümleri kullandı.
Teknik olarak zorlu çekimler için Jim çeşitli video araçlarıyla deneyler yaptı. Her aracın kendine göre güçlü yanları var. En çok kullanılan araçlar Jidream, Keling ve Pika'ydı.
O dönemde Jidream aksiyon sahneleri, Pika sahne çekimleri ve basit konuşma animasyonları konusunda öne çıkıyordu; Keling ise genel olarak güçlü yeteneklere sahipti ancak bazen belirli durumlarda gereksiz yere karmaşık olabiliyordu.
Günümüzün araçlarıyla bile, “The Thin Man The Gun The Hotpot”taki birçok sahneyi doğal olarak elde etmek zordur. Bu, geleneksel yöntemlere güvenmeyi gerektirir.
Örneğin, karakterler doğrudan öne bakmadığında veya yapay zekanın kolayca tanıyabileceği yakın çekimlerde olmadığında ve eylemler, ifadeler ve kamera açıları hareket halinde olduğunda, bir seslendirme sanatçısı videonun dudak hareketlerine göre dublaj yapmalıdır. Jim, yeni özelliklerin mutlaka yararlı olmadığına; eski yöntemlerin belki beceriksiz olsalar da daha güvenilir olduğuna inanıyor.
Niş ve Çeşitli
“The Thin Man The Gun The Hotpot” hikayesi, karakterlerin Sichuan lehçesini konuştuğu, Jim'in kişisel tercihi olan, Çin'in güneybatısındaki küçük bir kasabada geçiyor. “The Thin Man The Gun The Hotpot”un sanat tarzı da benzersizdir ve izleyiciler bunu “Love, Death & Robots” dizisinin bir bölümüyle karşılaştırır.
Jim, oyun sektöründeki çalışmalarında çok fazla benzer, denenmiş ve test edilmiş içerik gördü.
Yapay zeka tabanlı yaratım kişiselleştirilebilir. Yüksek kaliteli çalışmalar hâlâ büyük şirketlerin önemli kaynaklar yatırmasını gerektirir, ancak Jim "temel bir çalışma" yaratmada daha fazla olasılık görüyor.
Midjourney'i kullanmaya başladığı andan itibaren Jim, "ana akım" bir tarzda yaratmak istemediğini açıkça belirtti. Midjourney'i yoğun bir şekilde kullanan Jim, AI'nın kolayca ürettiği ve aynı zamanda kendisinin de yasak bölgeleri olan stillerin gayet farkında.
Hemen tanınacak tarzda olmayan, retro hissi veren ama tamamen eski moda olmayan animasyonları tercih ediyor; tanıdık ama aynı zamanda yenilikçi.
Jim, “The Thin Man The Gun The Hotpot” adlı çizgi filminin sanat stili için animasyon yönetmeni Masaaki Yuasa ve manga sanatçısı Yoshiharu Tsuge'ye gönderme yaptı.
İlk olarak, stillerinin anahtar kelimelerini anlamak için Midjourney'nin Describe özelliğini kullandı, ardından sürekli olarak istemler yazdı ve gereksinimlerini karşılayan görseller üretmek için tekrar tekrar yinelemeler yaptı.
“The Thin Man The Gun The Hotpot”un dünya görüşü büyük ölçüde Jim’in aşina olduğu bölgelerden ve unsurlardan kaynaklanıyor.
Jim, 2019 yılında Diao Yinan'ın yönettiği ve başrolünde Hu Ge'nin oynadığı "The Wild Goose Lake" filmini izledi ve filmin "noir estetiği ve özüyle gerçekçi ortamı" karşısında derinden etkilendi. Geleneksel tür filmlerinin taştan oyulmuş olmadığını ve Çin anlatılarında yeni bir canlılık olduğunu fark etti.
Jim, 2021 yılında küçük bir kasaba, çaresiz bir genç adam ve bir yaşam çıkmazı da dahil olmak üzere "The Thin Man The Gun The Hotpot" filminin temel taslağını oluşturan senaryoyu yazmaya başladı.
Jim, 2023 yılında yapay zeka konsept sanatını öğrenmek için Midjourney'i kullanmaya başladı.
Ancak, 2024'ten önce Jim aslında bir AI filmi yapmayı hiç düşünmedi. Kendi kendine fotoğrafçılık, senaryo yazarlığı ve sinematografi öğrendi ancak orada durdu. Videolar hikayeleri mercekler aracılığıyla anlatır ancak kendi set çekimlerini yaratamadı.
2024'ün başlarında Jim, Pika gibi en eski AI videolarından bazılarını kullanmaya başladı ve aniden sahneleri canlandırabileceğini, görüntüleri ayarlayıp değiştirebileceğini ve bunları bir kısa film tamamlamak için birleştirebileceğini fark etti. Yaratma arzusu benzeri görülmemiş bir şekilde güçlendi.
Malzemeler hazır olduğunda, düzenleme, ses efektleri, dublaj ve müzik zamanı gelmişti. Jim, geleneksel film yapım sürecini daha derinlemesine inceledi. Deney yaptı ve öğrendi, yavaş yavaş Bilibili'ye bazı stilize edilmiş, kişisel olarak ayırt edici çalışmalar yükledi.
Jim'in diğer yapay zeka kısa filmi "Hard Bop Gunman", eski Amerikan çizgi romanları ve sessiz filmlerin tarzından esinlenerek yapılmış ve daha sonra 1905 Movie Network ve Bilibili gibi platformlarda düzenlenen bir yapay zeka video yarışmasının Yaratıcılık Alanı'nda ödül kazanmıştır.
Yapay zeka henüz pek çok sektörü altüst etmedi, ancak küçük ekipler ve bireysel içerik üreticileri için yaratma maliyeti kabul edilebilir hale geldi ve çeşitli içeriklerin izleyiciler tarafından görülme şansı var.
“The Thin Man The Gun The Hotpot”u Sichuan-Chongqing bölgesine yerleştiren Jim, bunun bir bakıma “kasıtlı” olduğunu kabul ediyor. Niş içerik oluştururken artık geleneksel “çok riskli” kavramı hakkında fazla endişelenmeye gerek olmadığını kanıtlıyor.
Sınırlı, Ancak Benzersiz
10 dakikalık bir "The Thin Man The Gun The Hotpot" Bilibili'de uzun bir video olarak kabul edilmeyebilir. Ancak AI topluluğunda 10 dakika nadir bir uzunluktur, ayrıca "The Thin Man The Gun The Hotpot"un eksiksiz bir hikaye anlattığını da söylemeye gerek yok.
Jim, bu 10 dakikayı tamamlamak için hem kendini hem de yapay zekayı sınırlarına kadar zorladı.
“The Thin Man The Gun The Hotpot” filmindeki güveç restoranındaki aksiyon sahneleri Jim'in her çekimi tasarlarken çok emek harcamasına rağmen, nihai etki %40'tan azdı.
Jim, AI'nın aksiyon sahnelerinin gerçekten eksik olduğunu, etki duygusunun olmadığını ve havaya çarpma gibi fiziksel mantığı takip etmediğini kabul ediyor. Sadece aksiyon sahneleri değil, boğulma, çekiç fırlatma veya taşla vurma gibi önemli hareketlerin olduğu herhangi bir sahne AI'nın başarması zor.
Jim'in deneyimine göre, AI için aksiyon sahneleri tasarlamak zorundaysanız, soğuk silahlardan kaçının ve bunun yerine ateşli silahlar kullanın, çünkü AI en azından atış simülasyonu yapabilir. Kendisi de bu tekniği kullanmıştır, "Kurtarma için eski Hong Kong filmlerine teşekkürler."
Gerçek aktörler aksiyon sahnelerinde zorlandığında, dublörler devreye girebilir, ancak ifadeli yüz ifadeleri bir aktörün temel becerisidir. Ancak bu, aşırı hareket eden veya hiç ifade göstermeyen AI için de zayıf bir noktadır.
Ekim 2024'te Runway, yapay zeka karakterlerini gerçek insan performans videolarına dayalı aynı ifadeleri yapmaya yönlendiren Act-One özelliğini başlattı. Jim, bunu daha fazla ürünün benzer özellikler piyasaya sürmesi durumunda yapay zekanın performansta gerçekten bir darboğaz yaşadığının bir işareti olarak görüyor.
“The Thin Man The Gun The Hotpot”ta karakterler genellikle yakın çekimlerde ve yarı vücut çekimlerinde görünür ve bu da yapay zekanın bir zayıflığını yansıtır: birden fazla öznenin olduğu çekimleri idare etmek. Jim, çekimleri tasarlarken birden fazla kişinin olduğu sahnelerden kaçınmaya çalışır çünkü henüz iyi bir çözüm bulamamıştır.
Midjourney ile görüntü oluştururken bile, iki kişiden fazla kişi varsa, yüz sorunları ortaya çıkabilir. AI video etkileşimlerine yerleştirildiğinde, sahne daha da kaotik hale gelir.
Yapay zeka tarafından oluşturulan görsellerin birçok sınırlaması vardır, bu nedenle Jim post prodüksiyonda görsel eksiklikleri telafi etmek için yakın çekimler, sembolik çekimler ve hızlı kesmeler kullanır. "The Thin Man The Gun The Hotpot"taki tekrarlayan hayvan görüntüleri buna bir örnektir.
Metaforlar ve sembolizm bazı klasik Amerikan kara filmlerinde de yaygın olarak kullanılır. 1940'larda ve 50'lerde, şiddet içeren görüntüleri kısıtlayan Hays Kodu gibi teknik sınırlamalar ve düzenlemeler nedeniyle durum 2024'teki AI videolarına benzerdi.
Jim için onlarca yıl boyunca yankılanan bu durum ilgi çekici: "Belki de eski yöntemler yapay zeka filmlerinde işe yarıyordur."
Ancak izleyiciler dürüsttür ve "akıcı bir PowerPoint sunumu" veya "geliştirilmiş dinamik bir çizgi roman" gibi geri bildirimler sunarlar. Jim bunu kabul eder ve bu yüzden yapay zeka animasyonları yapmayı seçer.
Pürüzsüz tenli, ürkütücü şekilde hareket eden gerçek yaşam tarzıyla karşılaştırıldığında, animasyon en azından "izleyicilerin hemen, vay canına, bu çok sahte, diye düşünmesine neden olmuyor." Karakterlerin hafif gergin ve katı hareketleri gerçekçi olmayan animasyonlarda daha kabul edilebilir.
Körü körüne uzunluğu takip etmemek ve önce kaliteyi sağlamak kısmen Jim'in normal filmlerle kıyaslamasından kaynaklanıyor. AI etiketini göz ardı edip hikayenin kendisine odaklanmalarını sağlamak için AI olmayan yarışma Independent Shorts Awards'a katıldı.
Jim, izleyicilerin çalışmalarını izlerken yapay zekanın varlığının farkında olmasını ancak yapay zekaya yönelmemesini umuyor ve yapay zeka film değerlendirme sisteminde müsamaha göstermiyor: "Yapay zeka topluluğu çok arkadaş canlısı, birkaç sert söz duymak gerekiyor."
Kaygıyı Yenmek İçin Yaratılışta Israr Etmek
Yapay zeka haberlerinde sıklıkla "bir gecede meydana gelen değişiklikler"den bahsediliyor ve üç ayda kısa bir film çekmek bile uzun bir zaman.
Yapay zeka her gün ilerliyor. Jim, 2023'te günlük yapay zeka bilgilerine ayak uydurabilirdi ancak 2024'ün başlarından itibaren trendlere ayak uydurmak imkansız hale geldi. Ayrıca kaygılı hissediyor ancak diğer birçok kişi gibi körü körüne değil.
Teknoloji güçlüdür, ancak insanların yapması gereken çok iş vardır. Yaratılıştaki zorluk ve ilgi, bazı sorunların yaratıcının kendisi tarafından çözülmesi gerektiği gerçeğinde yatmaktadır.
"Vahşi Kaz Gölü"nde Jim'in üzerinde derin izler bırakan bir silahlı çatışma sahnesi vardır: İnsanlar meydanda dans etmektedir, sivil polisler parlayan ayakkabılar giymektedir, suçlular ateş etmektedir, polis parlayan kanla kovalamaca yapmaktadır ve sonra onlar da ateş etmektedir.
Gergin ama eğlenceli karşıtlık Jim'i etkiledi. Bu sahne olmadan, kare dansına ilk tepki "bayağı" olurdu.
Tanıdık öğelerin çoğu zaman güncelliğini yitirmediğini, ancak yaratıcıları tarafından derinlemesine incelenmediğini düşünüyor.
Buna karşılık, eski araçlarla dikkatlice ifade edilen şeyler, yeni teknolojiyle değiştirilemeyebilir.
Yapay zeka videoları birçok kez güncellendi, ancak Jim önceki yapay zeka kısa filmlerini yeniden yapmayı planlamıyor.
Tüm kısa filmin tasarımı ve uzlaşmaları, o dönemdeki AI'nın sınırlamalarına dayanıyordu ve bütünsel bir varlık oluşturuyordu. Yıllar sonra bile, hala eğlenceli yönleri var ve işin değeri de burada yatıyor.
Yapay zeka, Jim'in daha benzer deneyleri tamamlamasına, ilginç şeyleri yeniden düşünmesine yardımcı olabilir. Yapay zekanın doğrudan cevap vermesini sevmiyor; sorunları kendisi çözmeyi, yapay zekayı hesap makinesine benzer bir araç olarak kullanmayı tercih ediyor.
Jim, reklam veya müzik videoları üretmek için AI kullanmaya kıyasla hala hikayeler anlatmak için AI kullanmayı tercih ediyor. Ona göre, "anlatı, film yaratımının orijinal amacıdır."
Birkaç yıl önce, Jim kendi kendine senaryo yazmayı öğrendiğinde, sadece kitap okumakla kalmadı, aynı zamanda senaryolar yazarak ve onları tamamlayarak pratik yaptı, "Bitirmezsen, bunun pek bir anlamı olmaz."
Aynı zamanda birçok film izliyordu, sürekli yenilerini izliyor, ilginç sahneler düzenliyor ve başkalarının açıklamalarını ve analizlerini izliyordu. "Sağlam bir temeli olmadığını" söylüyor ancak görüntülere karşı hassas, benzer nesneleri birbirine bağlamada iyi ve duyguları ve hisleri doğru bir şekilde iletmek için kamera dilini kullanmada daha iyi.
Şimdi Jim bir mola veriyor, AI yaratımlarını paylaşmayı, bir sonraki AI projesini hazırlamayı ve her AI video aracında son gelişmeleri yakalamayı planlıyor. Ona göre, kaç tane AI aracı olursa olsun, her kişinin yatırabileceği kaynaklar eşit ve vazgeçilmezdir. Miktar önemli değildir; kişinin kendisi için doğru yolu bulması daha önemlidir.
Jim'in Bilibili yorum bölümünde bir izleyici, izleme deneyimini "ruhsuz araçlar, ruhsal yaratım" olarak tanımladı. "Bu ifadenin çok fazla ağırlığı var" diye cevapladı.
Kaygıyla mücadele etmenin en iyi yolu yaratmaktır. Jim, AI'nın gelecekte ne yapabileceği veya kimin yerini alacağı konusunda spekülasyon yapmak istemiyor. Elinde sürekli yeni eserler yaratmanın bir kişinin sağlam kalesi olduğuna inanmayı tercih ediyor.
Kaynaktan ifan
Yasal Uyarı: Yukarıda belirtilen bilgiler Chovm.com'dan bağımsız olarak ifanr.com tarafından sağlanmaktadır. Chovm.com, satıcının ve ürünlerin kalitesi ve güvenilirliği konusunda hiçbir beyan ve garanti vermez. Chovm.com, içeriğin telif hakkıyla ilgili ihlallere ilişkin her türlü sorumluluğu açıkça reddeder.