الرئيسية » آخـر الأخبار » أداة الفيديو المعتمدة على الذكاء الاصطناعي والتي تحظى بشعبية كبيرة على Rednote تُحدث ثورة في إنشاء المحتوى
واجهة أداة Pika AI التي تعرض إنشاء الفيديو.

أداة الفيديو المعتمدة على الذكاء الاصطناعي والتي تحظى بشعبية كبيرة على Rednote تُحدث ثورة في إنشاء المحتوى

كان تحقيق الاتساق في مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي يشكل تحديًا دائمًا. وفي حين أن إنشاء نماذج وملابس افتراضية أمر بسيط، فإن إنشاء مقطع فيديو حيث يقوم إيلون ماسك بنمذجة معطف من الفرو يظل مهمة معقدة.

يقدم نموذج 2.0 الذي تم تحديثه مؤخرًا من Pika حلاً ذكيًا: من خلال تحميل صور متعددة، يمكن لـ Pika الرجوع إلى عناصر محددة لإنشاء مقاطع فيديو بدقة ملحوظة.

فيديو نموذجي تم إنشاؤه باستخدام نموذج Pika 2.0.

من خلال توفير صور الأشخاص والمنتجات والإعدادات، يمكن للمستخدمين إنشاء فيديو تجاري أساسي حيث تتطابق العناصر المرئية بشكل وثيق مع الصور الأصلية.

عينة فيديو إعلانية تم إنشاؤها تُظهر الاتساق في العناصر.

هل يعني هذا أن الذكاء الاصطناعي قد نجح في حل مشكلة اتساق مقاطع الفيديو، مما يخلق تحديات جديدة للمعلنين؟ ليس تمامًا. فرغم أن استخدام Pika ممتع، إلا أن التطبيق العملي لا يزال بحاجة إلى التحسين.

إنشاء مشاهد غير واقعية باستخدام بيكا

تتيح ميزة إدخال الصور المتعددة في تطبيق Pika، والتي تسمى "مكونات المشهد"، للمستخدمين الجمع بين الصور وإنشاء سيناريوهات فريدة. وإليك كيفية عملها:

  1. قم بتحميل ما يصل إلى ست صور بالضغط على زر "+".
  2. أضف مطالبة بسيطة في مربع النص.

على سبيل المثال، لنجعل إيلون ماسك وألترامان يشاهدان فيلمًا معًا. الموضوع: يجلس شخصان في مسرح مظلم، ممسكين بالفشار ويركزان على الشاشة بترقب... 

ما عليك سوى تحميل صورهم، وستُنشأ بيئة المسرح بناءً على الطلب. وفي حين يبدو إيلون ماسك واقعيًا، فإن مظهر ألترامان يبدو مبالغًا فيه ومنفصلًا عن الصورة الأصلية.

فيديو رسوم متحركة للمشهد المسرحي تم إنشاؤه باستخدام Pika.

من السمات المميزة لـ Pika هي قدرته على "إعادة استخدام" العناصر. على سبيل المثال، يمكننا أن نلبس Musk وUltraman معاطف خضراء متطابقة وننشئ جلسة تصوير أزياء. 

تم الحصول على صور الشخصين من صور جاهزة. تم إنشاء المعطف الأخضر والخلفية الثلجية الجليدية بشكل منفصل باستخدام الذكاء الاصطناعي، مع نص "AIGC" على المعطف بمثابة تحدي لبيكا. 

وأظهرت النتيجة تناسقًا لائقًا بين المشهد والمعطف، وكان نص "AIGC" قابلاً للتمييز بشكل خافت. كما اتبعت أوضاع العارضات التعليمات. لكن المشكلة الأكبر هي من هما هذان الشخصان؟ قد لا تكون الوجوه في الفيديو والصور متطابقة، لكنها غير مرتبطة تمامًا.

مشهد أزياء يضم معاطف خضراء تم إنشاؤه باستخدام البيكا.
فيديو رسوم متحركة لمشهد التصوير الفوتوغرافي للأزياء.

بعد ذلك، قمنا باختبار تخصيص ملابس بيكا من خلال إنشاء قميص أسود يحمل عبارة "كنت إنسانًا". وأضفنا صورة لمارك زوكربيرج وصورة لآلة العود لإنشاء عرض موسيقي. 

اتبع بيكا التعليمات بشكل جيد، وكانت حركة الكاميرا سلسة. كما تم ارتداء الملابس بسلاسة، لكن اليد اليمنى، وخاصة الإبهام، لا تزال غير مثالية.

مشهد تم تصويره لزوكربيرج وهو يعزف على آلة العود في غرفة مريحة.
زوك يغني ويعزف على الجيتار

بالمقارنة مع Google Veo وOpenAI Sora، فإن نموذج Pika ليس الأفضل على الإطلاق. فحل مشكلة واحدة غالبًا ما يكشف عن المزيد من الأخطاء.

بعد تجربة أسلوب واقعي، دعنا ننتقل إلى أسلوب الأنمي. لكي يكون جينتوكي ساكاتا وناروتو أوزوماكي في نفس الإطار، اخترت صورتين بسماء زرقاء وسحب بيضاء كخلفية.

تمتزج الخلفية بشكل طبيعي، وتم التقاط التعبيرات بشكل جيد، مع تأثير الرياح على الشعر والملابس بشكل جيد. ومع ذلك، فإن تأثير الدوران مزعج للغاية. تبدو عينا جينتوكي بلا حياة، وليستا متدحرجتين حقًا.

موجه
جينتوكي ساكاتا وناروتو أوزوماكي في نفس الإطار.

يمكنك أيضًا جعل اللوحات الشهيرة تتفاعل عبر العصور - مثل الموناليزا والفتاة ذات القرط اللؤلؤي وهي تأكل البطاطس المقلية في ماكدونالدز. التأثير ليس مثاليًا. عند رؤية الموناليزا، يتساءل المرء عما إذا كان دافنشي سيتقلب في قبره. تبدو الشخصيات مثل الملصقات الموضوعة في الفيديو، مع حركات رأس غريبة.

موجه
الموناليزا والفتاة ذات القرط اللؤلؤي تتناولان البطاطس المقلية في ماكدونالدز

في بعض الأحيان، يؤدي العودة إلى البساطة إلى نتائج جيدة بشكل غير متوقع. فعند تحميل صورة لمقهى ستاربكس ولوحة زنابق الماء لمونيه، نحصل على كوب قهوة يشبه زهرة اللوتس.

موجه
كوب قهوة يشبه زهرة اللوتس

التنافس مع النماذج المصنوعة في الصين، أصبح التحكم في فيديو الذكاء الاصطناعي أسهل الآن

إلى حد ما، نجح برنامج Pika في تحسين إمكانية التحكم في الفيديو. ورغم أنه لم ينجح تمامًا، كما هو الحال في الممارسة العملية، إلا أن برنامج Pika يحافظ على الاتساق في المشاهد والملابس والأشياء، ولكن الوجوه تميل إلى التشويه بغض النظر عن الأسلوب.

بالإضافة إلى ذلك، تحتاج قدرات بيكا الأساسية إلى التحسين. لا تزال الأفعال مثل الأكل أو العزف على البيانو تشكل تحديات. هل يمكن التخفيف من هذه المشكلات عن طريق سحب البطاقات؟

باختصار: ليس في المتناول. فبرنامج Pika 2.0 متاح حاليًا فقط لمستخدمي Pro وFancy، بتكلفة لا تقل عن 35 دولارًا شهريًا دون فترة تجريبية مجانية. وعلاوة على ذلك، يحصل مستخدمو Pro على 2000 نقطة شهريًا فقط، ولكن استخدام ميزة Scene Ingredients يكلف 100 نقطة لكل مقطع فيديو.

في الواقع، قام نموذج الفيديو الصيني Vidu الذي تم تصنيعه باستخدام الذكاء الاصطناعي بتنفيذ ميزة "المرجع المتعدد الصور" قبل Pika. وهو أكثر جاذبية للمستخدمين، حيث يقدم نقاط تجريبية مجانية.

واجهة فيدو
واجهة فيدو

لقد قمت باختبار بعض حالات بيكا على Vidu. تبدو الموناليزا والفتاة ذات القرط اللؤلؤي وهما تأكلان البطاطس المقلية وكأنهما خرجتا للتو من الأرض، لكن شبه الموناليزا أفضل من بيكا.

الموناليزا والفتاة ذات القرط اللؤلؤي تتناولان البطاطس المقلية في ماكدونالدز

إيلون ماسك وألترامان يشاهدان فيلمًا معًا، وجه ماسك دقيق بنسبة 70-80%، لكن وجه ألترامان لا يزال ليس رائعًا.

إيلون ماسك وألترامان يشاهدان فيلمًا معًا

جينتوكي ساكاتا وناروتو أوزوماكي في نفس الإطار، يمكن لـ Vidu إنشاء وجه جانبي من وجه أمامي، لكن الأسلوب يختلف عن الصورة الأصلية.

جينتوكي ساكاتا وناروتو أوزوماكي في نفس الإطار


بالإضافة إلى ذلك، فإن Vidu لديه حد مقارنة بـ Pika - فهو لا يمكنه تحميل أكثر من ثلاث صور كحد أقصى. لذا، عندما استخدمت Vidu لإنشاء جلسة تصوير أزياء لـ Musk و Ultraman، قمت فقط بتحميل صورهم ومعطف أخضر، وتركت الخلفية.

بدت النتائج غير مألوفة. ومن الواضح أن الحفاظ على استقرار الوجه لا يزال يشكل تحديًا.

صورة GIF متحركة تظهر جلسة تصوير أزياء مع ماسك وألترامان.

عند مقارنة Vidu بـ Pika، قد تختلف الآراء. يستخدم Pika إصدارًا احترافيًا، بينما يستخدم Vidu إصدارًا مجانيًا، مما يفسر بعض الاختلافات. ومع ذلك، فإن نهج Pika وVidu متشابه - باستخدام عدد قليل من مواد الصور والمطالبات البسيطة لتوليد كائنات مستقرة نسبيًا.

في إنشاء مقاطع الفيديو بالذكاء الاصطناعي، يتم حاليًا تحقيق الحفاظ على اتساق الموضوع بشكل أكثر موثوقية باستخدام حل LoRA. يتضمن ذلك ضبط النموذج بدقة باستخدام قدر معين من مادة موضوعية محددة. باستخدام المواد والتدريب المناسبين، يتعلم النموذج تدريجيًا سمات مظهر الشخصية.

ولكن لجعل مقاطع الفيديو التي تعتمد على الذكاء الاصطناعي أكثر سهولة في الوصول إليها وأكثر قيمة من الناحية التجارية، فلابد من خفض حاجز الدخول. وعلى الأقل مع Vidu وPika، نرى الإمكانات.

الانتشار السريع لمقاطع الفيديو القصيرة باستخدام الذكاء الاصطناعي: تذكرة ذهاب فقط للإبداع

بعد فترة وجيزة من إطلاق نموذج Pika 2.0، كان المستخدمون الدوليون يستمتعون بالفعل. من خلال إنشاء مقاطع فيديو بشكل متكرر في مشاهد مختلفة باستخدام صورهم الخاصة، يمكنهم تحقيق "سفر فوري عبر الكون". مع الذكاء الاصطناعي، أصبح تجربة الملابس على بعد نقرة واحدة فقط. تتدفق النماذج والأزياء بسلاسة، مما يوفر تكلفة التصوير الحقيقي.

لقد أعطاني اللعب مع بيكا شعورًا مشابهًا للعب "QQ Show" و"The Sims"، حيث قررنا كيفية ارتداء ملابس الشخصيات في الفيديو.

إذا كنت تريد تحقيق "حلم" ماسك، فالأمر سهل. أولاً، استخدم أدوات الذكاء الاصطناعي الأخرى لإنشاء قميص "Conquer Mars" وقبعة حمراء مكتوب عليها "MAGA".

بعد ذلك، قم بتحميل هذه الصور، مشهد المريخ، وصورة ماسك، والروبوت البشري Optimus Prime الخاص به، ونموذج Doge الميم المفضل لديه على الإنترنت إلى Pika.

وفي النهاية، يظهر شاب مشمس ومبهج، مع كلب على اليسار وروبوت على اليمين، ويبدو ودودًا ولكن ليس تمامًا مثل ماسك.

صورة لرجل على المريخ مع كلب وروبوت
صورة GIF متحركة لشاب مرح مع كلب وروبوت.

سواء كان يشبهه أم لا، فهذا أمر واحد؛ طالما أنك منفتح الذهن، فإن الاحتمالات لا حصر لها. باستخدام صورنا وصور المشاهير، يمكننا بسهولة الانخراط في مجتمع المعجبين. قم بتحميل القبعات والملابس والأدوات اللازمة لارتداء ملابسنا من الرأس إلى أخمص القدمين. قم بجمع المشاهد والمنتجات والعارضات، وستحصل على فيديو إعلاني بسيط...

يمكن للصور + صور الذكاء الاصطناعي + Pika 2.0 + المطالبات إنشاء العديد من الصور المرئية المثيرة للاهتمام. تتجنب هذه الطريقة أيضًا بعض أوجه القصور في نماذج الفيديو، مثل الكتابة، والتي يمكن حلها باستخدام نماذج الصور. دون التنافس بشكل مباشر مع قدرات نموذج Google أو المقارنة بأحلام Runway في هوليوود، فإن Pika لديه نهجه الفريد.

لطالما كانت Pika رائدة في الإبداع، حيث حققت سلسلتها السابقة من ميزات المؤثرات الخاصة بالذكاء الاصطناعي، Pikaffect، انتشارًا واسع النطاق عبر منصات مثل RedNote وTikTok، مما دفع قاعدة مستخدمي Pika إلى أكثر من 11 مليونًا.

صورة GIF متحركة للمؤثرات الخاصة التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
AI Pinch. الصورة من: Pika
صورة GIF متحركة لقطع الكعكة بالذكاء الاصطناعي.
تقطيع الكيك بالذكاء الاصطناعي. الصورة من: Pika

لقد استغلت شركة Pika مجموعة من المستخدمين الذين لديهم طلب كبير على مقاطع الفيديو القصيرة الترفيهية. وحتى لو كانت هذه المقاطع نمطية وعابرة، فما دامت ممتعة، فسوف يتهافت الناس عليها.

من قال إن الفوز يعني الحصول على كل شيء؟ إن سوق الذكاء الاصطناعي واسع، وفي حين أن محاكاة العالم المادي حلم كبير، فإن تحقيق الهدف الصغير المتمثل في جعل مقاطع الفيديو القصيرة التي يتم إنتاجها باستخدام الذكاء الاصطناعي ممتعة هو أيضًا شكل من أشكال النجاح.

مصدر من إيفان

إخلاء المسؤولية: يتم توفير المعلومات المذكورة أعلاه بواسطة ifanr.com، بشكل مستقل عن Chovm.com. لا تقدم Chovm.com أي تعهدات أو ضمانات فيما يتعلق بجودة وموثوقية البائع والمنتجات. ينكر موقع Chovm.com صراحةً أي مسؤولية عن الانتهاكات المتعلقة بحقوق الطبع والنشر للمحتوى.

اترك تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول المشار إليها إلزامية *

انتقل إلى الأعلى