Mencapai konsistensi dalam video yang dihasilkan AI selalu menjadi tantangan. Meskipun menghasilkan model dan pakaian virtual mudah, membuat video yang menampilkan Elon Musk mengenakan mantel bulu tetap menjadi tugas yang rumit.
Model 2.0 Pika yang baru-baru ini diperbarui menawarkan solusi cerdas: dengan mengunggah beberapa foto, Pika dapat merujuk elemen tertentu untuk menghasilkan video dengan akurasi yang luar biasa.
Dengan menyediakan foto orang, produk, dan pengaturan, pengguna dapat membuat video komersial dasar yang visualnya sangat mirip dengan gambar aslinya.
Apakah ini berarti AI telah memecahkan masalah konsistensi video, sehingga menciptakan tantangan baru bagi pengiklan? Tidak juga. Meskipun Pika menyenangkan untuk digunakan, kepraktisannya masih perlu ditingkatkan.
Menciptakan Pemandangan yang Tidak Nyata Bersama Pika
Fitur input multi-gambar Pika, yang disebut “Scene Ingredients,” memungkinkan pengguna untuk menggabungkan foto dan menghasilkan skenario yang unik. Berikut cara kerjanya:
- Unggah hingga enam gambar dengan mengklik tombol “+”.
- Tambahkan perintah sederhana dalam kotak teks.
Misalnya, mari kita ajak Elon Musk dan Ultraman menonton film bersama. Prompt: Dua orang duduk di teater yang gelap, memegang popcorn dan fokus ke layar dengan penuh harap…
Cukup unggah foto mereka, dan lingkungan teater pun tercipta dari perintah tersebut. Sementara Elon Musk tampak realistis, penampilan Ultraman terasa berlebihan dan tidak sesuai dengan foto aslinya.
Fitur menonjol dari Pika adalah kemampuannya untuk "menggunakan kembali" elemen-elemen. Misalnya, kita dapat mendandani Musk dan Ultraman dengan mantel hijau yang serasi dan membuat pemotretan mode.
Foto kedua orang tersebut sama-sama bersumber dari gambar yang sudah jadi. Mantel hijau dan latar belakang bersalju es dibuat secara terpisah menggunakan AI, dengan teks “AIGC” pada mantel tersebut menjadi tantangan bagi Pika.
Hasilnya menunjukkan konsistensi yang lumayan antara adegan dan mantel, dan teks "AIGC" samar-samar dapat dikenali. Pose para model juga mengikuti instruksi. Namun masalah terbesarnya adalah, siapakah kedua orang ini? Wajah dalam video dan foto mungkin tidak identik, tetapi keduanya sama sekali tidak berhubungan.
Selanjutnya, kami menguji kustomisasi pakaian Pika dengan membuat kaus hitam bertuliskan "I was human". Kami menambahkan foto Mark Zuckerberg dan foto ukulele untuk membuat pertunjukan musik.
Pika mengikuti perintah dengan baik, dan gerakan kameranya lancar. Pakaiannya juga dikenakan dengan mulus, tetapi tangan kanan, terutama ibu jari, masih belum sempurna.
Dibandingkan dengan Google Veo dan OpenAI Sora, model Pika tidaklah terbaik. Memecahkan satu masalah sering kali mengungkap lebih banyak kesalahan.
Setelah mencoba gaya realistis, mari beralih ke gaya anime. Untuk menempatkan Gintoki Sakata dan Naruto Uzumaki dalam satu frame, saya memilih dua gambar dengan langit biru dan awan putih sebagai latar belakang.
Latar belakangnya menyatu secara alami, dan ekspresinya tertangkap dengan baik, dengan efek angin pada rambut dan pakaian yang pas. Namun, efek berputarnya cukup meresahkan. Mata Gintoki tampak tak bernyawa, tidak benar-benar berputar ke belakang.
Anda juga dapat membuat lukisan-lukisan terkenal berinteraksi lintas era—seperti Mona Lisa dan Gadis dengan Anting Mutiara yang sedang makan kentang goreng di McDonald's. Efeknya tidak ideal. Melihat Mona Lisa, orang bertanya-tanya apakah Da Vinci akan berbalik di kuburnya. Karakter-karakter tersebut tampak seperti stiker yang ditempatkan di video, dengan gerakan kepala yang aneh.
Terkadang, kembali ke kesederhanaan menghasilkan hasil yang baik secara tak terduga. Mengunggah gambar Starbucks dan lukisan Bunga Teratai karya Monet menghasilkan cangkir kopi yang “mirip bunga teratai”.
Bersaing dengan model buatan China, mengendalikan video AI kini lebih mudah
Hingga taraf tertentu, Pika telah meningkatkan kemampuan kontrol video. Meskipun tidak sepenuhnya berhasil, seperti yang terlihat dalam praktik, Pika mempertahankan konsistensi dalam adegan, pakaian, dan objek, tetapi wajah cenderung terdistorsi terlepas dari gayanya.
Selain itu, kemampuan dasar Pika perlu ditingkatkan. Tindakan seperti makan atau bermain piano masih menjadi tantangan. Bisakah masalah ini diatasi dengan menggambar kartu?
Dalam tiga kata: tidak terjangkau. Pika 2.0 saat ini hanya tersedia untuk pengguna Pro dan Fancy, dengan biaya setidaknya $35 per bulan tanpa uji coba gratis. Selain itu, pengguna Pro hanya mendapatkan 2000 poin per bulan, tetapi menggunakan fitur Scene Ingredients dikenakan biaya 100 poin per video.
Faktanya, model video AI buatan Tiongkok, Vidu, menerapkan fitur "referensi multi-gambar" lebih awal daripada Pika. Fitur ini lebih menarik bagi pengguna karena menawarkan poin uji coba gratis.
Saya menguji beberapa kasus Pika di Vidu. Mona Lisa dan Gadis dengan Anting Mutiara yang sedang makan kentang goreng tampak seperti baru saja muncul dari tanah, tetapi rupa Mona Lisa lebih baik daripada Pika.
Elon Musk dan Ultraman menonton film bersama, wajah Musk sekitar 70-80% akurat, tetapi wajah Ultraman masih belum bagus.
Gintoki Sakata dan Naruto Uzumaki dalam bingkai yang sama, Vidu dapat menghasilkan wajah samping dari wajah depan, tetapi gayanya berbeda dari gambar aslinya.
Selain itu, Vidu memiliki keterbatasan dibandingkan dengan Pika—hanya dapat mengunggah maksimal tiga gambar. Jadi, ketika saya menggunakan Vidu untuk membuat pemotretan busana untuk Musk dan Ultraman, saya hanya mengunggah foto mereka dan mantel hijau, tanpa menyertakan latar belakang.
Hasilnya terasa asing. Jelas bahwa menjaga kestabilan wajah masih menjadi tantangan.
Ketika membandingkan Vidu dengan Pika, pendapat mungkin berbeda-beda. Pika menggunakan versi profesional, sedangkan Vidu menggunakan versi gratis, yang menjelaskan beberapa perbedaan. Namun, pendekatan Pika dan Vidu serupa—hanya menggunakan beberapa materi gambar dan perintah sederhana untuk menghasilkan objek yang relatif stabil.
Dalam pembuatan video AI, menjaga konsistensi subjek saat ini lebih dapat diandalkan dengan solusi LoRA. Ini melibatkan penyempurnaan model dengan sejumlah materi subjek tertentu. Dengan materi dan pelatihan yang memadai, model secara bertahap mempelajari fitur penampilan karakter.
Namun, untuk membuat video AI lebih mudah diakses dan bernilai komersial, hambatan masuk perlu diturunkan. Setidaknya dengan Vidu dan Pika, kami melihat potensinya.
Menjadi Viral dengan Video Pendek AI: Tiket Sekali Jalan Menuju Kreativitas
Tak lama setelah peluncuran model 2.0 Pika, pengguna internasional sudah sangat menikmatinya. Dengan berulang kali membuat video dalam berbagai adegan menggunakan foto mereka sendiri, mereka dapat melakukan "perjalanan instan ke seluruh dunia." Dengan AI, mencoba pakaian hanya dengan sekali klik. Model dan pakaian dapat terlihat dengan mudah, sehingga menghemat biaya pemotretan sungguhan.
Bermain-main dengan Pika memberi saya perasaan yang mirip dengan bermain “QQ Show” dan “The Sims,” di mana kita memutuskan cara mendandani karakter dalam video.
Jika Anda ingin mewujudkan "mimpi" Musk, caranya mudah. Pertama, gunakan alat AI lainnya untuk membuat kaus bertuliskan "Conquer Mars" dan topi merah bertuliskan "MAGA".
Lalu, unggah gambar-gambar ini, pemandangan Mars, foto Musk, robot humanoid Optimus Prime miliknya, dan prototipe meme internet favoritnya, Doge, ke Pika.
Pada akhirnya, seorang pemuda yang ceria dan periang muncul, dengan seekor anjing di sebelah kiri dan sebuah robot di sebelah kanan, tampak ramah tetapi tidak seperti Musk.
Apakah mirip atau tidak adalah satu hal; selama Anda berpikiran terbuka, kemungkinannya tidak terbatas. Dengan menggunakan foto diri kita dan selebritas, kita dapat dengan mudah terlibat dalam fandom. Unggah topi, pakaian, dan instrumen untuk mendandani diri kita dari ujung kepala hingga ujung kaki. Kumpulkan adegan, produk, dan model, dan Anda akan mendapatkan video komersial sederhana…
Foto + gambar AI + Pika 2.0 + perintah dapat menghasilkan banyak visual yang menarik. Metode ini juga menghindari beberapa kekurangan model video, seperti tulisan, yang dapat diatasi dengan model gambar. Tanpa bersaing langsung dengan kemampuan model Google atau membandingkannya dengan impian Hollywood Runway, Pika memiliki pendekatan yang unik.
Pika selalu menjadi ahli dalam kreativitas, dengan rangkaian fitur efek khusus AI sebelumnya, Pikaffect, yang menjadi viral di berbagai platform seperti RedNote dan TikTok, mendorong basis pengguna Pika melampaui 11 juta.
Pika telah memanfaatkan sekelompok pengguna dengan permintaan tinggi akan video pendek yang menghibur. Meskipun video-video ini bersifat sementara dan singkat, selama video tersebut menyenangkan, orang-orang akan berbondong-bondong menontonnya.
Siapa bilang menang berarti menang segalanya? Pasar AI sangat luas, dan meskipun simulasi dunia nyata merupakan mimpi besar, mencapai tujuan kecil untuk membuat video pendek AI menjadi menyenangkan juga merupakan bentuk keberhasilan.
Sumber dari jika
Penafian: Informasi yang diuraikan di atas disediakan oleh ifanr.com, independen dari Chovm.com. Chovm.com tidak membuat pernyataan dan jaminan mengenai kualitas dan keandalan penjual dan produk. Chovm.com secara tegas melepaskan tanggung jawab apa pun atas pelanggaran yang berkaitan dengan hak cipta konten.