کور » تازه ترین خبرونه » د مصنوعي ذهانت ویډیو نوښت: د لاسونو څخه پاک کارت انځورولو انقلاب
د AI ویډیو ټیکنالوژۍ د پوښ انځور.

د مصنوعي ذهانت ویډیو نوښت: د لاسونو څخه پاک کارت انځورولو انقلاب

د "سکویډ لوبې" له لیدلو وروسته راضي نه یاست؟ خپل پای جوړ کړئ.

انځور د سکویډ لوبې څخه
د دودیز سکویډ لوبې پای ته رسیدو GIF

د "ډون دریمې برخې" لپاره انتظار نه شم کولی؟ خپله نسخه جوړه کړئ.

انځور د ډون څخه
د دودیز ډېون صحنې GIF

پخوا، د کرکټرونو دوامداره څرګندیدو لپاره د پام وړ وخت ته اړتیا وه. اوس، یوازې د سکرین شاټ سره، مصنوعي ذهانت کولی شي فلمونه جوړول پیل کړي.

دا د کونچ AI د "موضوع حوالې" ځانګړتیا څخه مننه ده، چې د نوي S2V-01 ماډل لخوا پرمخ وړل کیږي. دا په سمه توګه په اپلوډ شوي عکسونو کې موضوع پیژني او په تولید شوي ویډیوګانو کې یې د کرکټر په توګه ټاکي. پاتې نور ساده دي: د اساسي لارښوونو سره په آزاده توګه جوړ کړئ.

GIF د مخ د معلوماتو دقیق ساتنه ښیې
د ایکس کارونکي @KarolineGeorges لخوا رامینځته شوی، د مخ دقیق معلومات ساتلو سره"
GIF چې مختلف موضوعات ښیې
د ایکس کارونکي @Apple_Dog_Sol لخوا جوړ شوی، چې متنوع موضوعات ښیې"

د "موضوع حوالې" ځانګړتیا ګټې

ډیری شرکتونه د "موضوع حوالې" ځانګړتیاوې رامینځته کوي، مګر ټول نشي کولی د ثبات او همغږۍ ننګونو سره مقابله وکړي، په ځانګړې توګه په حرکت کې د ثبات ساتل.

پداسې حال کې چې نور ممکن مبارزه وکړي، کونچ AI غوره دی. یوازې د یو انځور سره، دا د کرکټر ځانګړتیاوې په سمه توګه پوهیږي، دوی د موضوع په توګه پیژني، او په مختلفو صحنو کې یې ځای په ځای کوي.

یوه شیبه سپایډر مین نړۍ ژغوري، بله شیبه هغه موټرسایکل چلوي.

په جال کې غڼه

غڼه په جال کې حرکت کوي

د ډریګونونو مور، چې باید په "ګیم اف تھرونز" کې ډریګونونو ته روزنه ورکړي، اوس د یو کوچني لیوه سره لوبې کوي.

د ډریګون مور د لیوه سره
د ډریګون مور د لیوه سره لوبې کوي

د "موضوع حوالې" کې پرمختګ د تخلیقي آزادۍ او وفادارۍ ترمنځ توازن ترلاسه کولو کې دی. دا د جوړونکو ته د "نړیوال لوبغاړي" ورکولو په څیر دی چې بڼه یې نه خرابیږي مګر په طبیعي ډول د عملونو او پوزونو سره بدلیږي، د ډایرکټر لخوا اړتیا سره سم په هره صحنه کې هر عمل ترسره کوي.

نه یوازې یوه نوې ځانګړتیا، بلکې یوه بې ساري تخنیکي حل لاره

د ازموینې اصلي تجربه ښیي چې د موضوع حواله یو مختلف فعالیت دی، د متن څخه انځور یا انځور څخه انځور تولید په پرتله مختلف تخنیکي ننګونې او اړتیاوې لري.

د انځور څخه ویډیو ته دودیز نسل یوازې جامد انځورونه متحرک کوي، په عمده توګه د جزوي بدلونونو سره. د مثال په توګه، د سونګ های کیو په دې سټیل کې، انځور څخه ویډیو یوازې جامد انځور په محدود حد او هیڅ مهم حرکت سره متحرک انځور ته اړوي.

د سونګ های کیو اصلي انځور
اصلي لا هم
د سونګ های کیو انیمیشن شوی صحنه
ویډیو د انځور څخه ویډیو ته جوړه شوې

د ورته عکس سره، "موضوع حواله" کولی شي د متن اشارو پراساس یو بشپړ برخه رامینځته کړي، چې د مخ مستحکم ځانګړتیاو ساتلو پرمهال آزاد حرکت ته اجازه ورکوي.

د سونګ های کیو ویډیو جوړه شوې
د تیاتر په نندارچیانو کې ګرمه داخلي رڼا، د فلم اصلي لوبغاړی په تور سوټ کې، د قطار په منځ کې کیڼ اړخ ته ناست دی. د هغې څرګندونې متمرکزې دي، کله ناکله په نرمۍ سره موسکا کوي، په طبیعي او تالنده ډول لاسونه وهي. کیمره د هغې له اړخ څخه پیل کیږي، د نورو لیدونکو غړو او د څوکۍ د تیاره جوړښتونو سیلویټونه نیسي، د چاپیریال ژوروالی ټینګار کوي. لکه څنګه چې کیمره دننه حرکت کوي، فلم اصلي لوبغاړی ودریږي.

اوس مهال د موضوع سره د ویډیوګانو د تولید لپاره دوه تخنیکي لارې شتون لري. یوه د LoRA ټیکنالوژۍ پر بنسټ ده، کوم چې مخکې له مخکې روزل شوي لوی تولیدي ماډلونه ښه تنظیموي. LoRA د نوي ویډیوګانو د تولید پرمهال د پام وړ محاسبې ته اړتیا لري، کاروونکو ته اړتیا لري چې د ورته موضوع ډیری زاویې اپلوډ کړي، حتی د کیفیت ډاډ ترلاسه کولو لپاره د هرې برخې لپاره مختلف عناصر مشخص کړي. دا ډیری ټوکنونه هم مصرفوي او اوږد انتظار وخت ته اړتیا لري.

د پراخو تخنیکي پلټنو وروسته، مینی میکس د عکس حوالې پراساس یوه لاره غوره کړه: انځورونه خورا دقیق بصري معلومات لري، د فزیکي شوټینګ تخلیقي منطق سره سمون لري. پدې لاره کې، په عکس کې اصلي لوبغاړی د ماډل د پیژندنې لپاره لومړیتوب دی - پرته له دې چې وروسته صحنې یا پلاټ وي، موضوع باید ثابت پاتې شي.

نور بصري معلومات ډیر خلاص دي او د متن اشارو لخوا کنټرول کیږي. دا طریقه د "دقیق تکثیر + لوړې آزادۍ" هدف ترلاسه کوي.

د ډریګون مور د ډریګون سره
کرکټر د یو اژدها مخې ته ولاړ دی، ویښتان او جامې یې په باد کې الوځي.
د درې په یوه پاکه سیمه کې، اصلي لوبغاړی د یو اژدها مخې ته ولاړ دی، د دوی اوږده ویښتان په باد کې روان دي. کیمره په تدریجي ډول زوم کوي، د فلم اصلي لوبغاړی د لرې واټن ته د کتلو لپاره عکس اخلي. د اژدها وزرونه خپاره شوي، د فلم اصلي لوبغاړی ویښتان او جامې یې والوزولې، او صحنه د سر په شاټ سره پای ته رسیږي.

په دې ویډیو کې، د ډریګن ملکې یوازې یو انځور ماډل ته ورکړل شوی و. وروستۍ تولید شوې ویډیو په سمه توګه د کیمرې ژبه او بصري عناصر وړاندې کړل چې په پرامپټ کې ذکر شوي، چې د قوي پوهې ښودنه کوي.

د LoRA حل په پرتله، دا تخنیکي طریقه د کاروونکو لخوا د اپلوډ کولو لپاره د اړتیا وړ موادو مقدار د پام وړ کموي، چې لسګونه ویډیو برخې په یوه عکس بدلوي. د انتظار وخت په ثانیو کې اندازه کیږي، د هغه وخت سره ورته احساس کوي چې د متن یا عکسونو تولید لپاره وخت نیسي - د عکس څخه ویډیو دقت د متن څخه ویډیو د آزادۍ سره یوځای کوي.

د چینایي تولیداتو مهم ټکي، ستاسو د ګڼو اړتیاوو پوره کول

ګڼ شمېر اړتیاوې ډېرې غوښتنې نه دي. یوازې په ورته وخت کې د دقیقو او ثابتو کرکټرونو انځورونو او آزاد حرکت ترلاسه کولو سره، ماډل کولی شي د ساده تفریحي کارونو څخه تیر شي او په صنعت کې پراخه ارزښت ولري.

د مثال په توګه، د محصول په اعلاناتو کې، د یو واحد ماډل عکس کولی شي په مستقیم ډول د پرامپټ کلمو په بدلولو سره د محصول مختلف ویډیوګانې رامینځته کړي.

په حرکت کې منډه وهونکی، د متحرک ویډیو تولید ښیې.
د شیشې محصول ویډیو، د مفصل بصري نسل روښانه کول.

که چیرې د عکس څخه ویډیو طریقې کاروئ، نو اوسنی اصلي حل دا دی چې لومړی او وروستی چوکاټونه تنظیم کړئ، چې اغیز یې د موجوده عکسونو لخوا محدود وي. دا د مختلفو زاویو راټولولو او بیا د شاټونو د لړۍ بشپړولو لپاره د موادو سره یوځای کولو لپاره تکراري هڅو ته هم اړتیا لري.

د ویډیو جوړولو کاري فلو سره د ښه سمون لپاره د مختلفو ټیکنالوژیو ځانګړتیاوو سره یوځای کول د "موضوع حوالې" ګټه ده. په راتلونکي کې، د بازار موندنې 80٪ څخه ډیر مسلکیان به په مختلفو مرحلو کې تولیدي وسایل وکاروي، یوازې په کیسه او پلاټ مفهوم تمرکز وکړي، خپل لاسونه آزاد کړي.

د سټیسټا په وینا، په ۲۰۲۱ کال کې د اعلاناتو او بازار موندنې په برخه کې د تولیدي مصنوعي ذهانت محصولاتو د بازار اندازه له ۱۵ ملیارد ډالرو څخه زیاته شوه. تر ۲۰۲۸ پورې به دا شمېره ۱۰۷.۵ ملیارد ډالرو ته ورسیږي. په تیرو کاري جریانونو کې، خالص متن څخه ویډیو ډیر بې کنټروله عوامل درلودل، چې د جوړولو د لومړیو مرحلو لپاره مناسب وو. په اروپایی او امریکایی اعلاناتو او بازار موندنې صنعتونو کې، تولیدي مصنوعي ذهانت لا دمخه خورا عام دی، د مسودو او پلان کولو لپاره د کارولو ۵۲٪ قضیې، او د مغزو د جوړولو لپاره ۴۸٪.

اوس مهال، هایلو AI لومړی د یو واحد کرکټر لپاره د حوالې وړتیا پرانیزي. په راتلونکي کې، دا به ډیری کرکټرونو، شیانو، صحنو او نورو ته پراختیا ورکړي، چې تخلیقیت به نور هم پراخ کړي، لکه څنګه چې د هایلو شعار، "هر نظر یو بلاک بسټر دی" لخوا وړاندیز شوی.

له هغه وخته چې مینی میکس د ۲۰۲۳ کال په اګست کې د ویډیو ماډل خپور کړ، دا په دوامداره توګه په نړیواله کچه د کاروونکو لوی شمیر راجلب کړی دی، د تولید شوي عکسونو کیفیت او نرموالي څخه تر دوام او ثبات پورې، ډیر مثبت غبرګونونه او مسلکي پیژندنه یې ترلاسه کړې.

د هایلو AI لوګو
د ټیک هاله لوګو.

د ټیکنالوژیکي سیالۍ په تیر کال کې، د AI ویډیو تولید ډګر سیالي منظره په پیل کې راڅرګنده شوه. د سورا پلي کولو د ویډیو تولید ظرفیت وښود، چې لوی ټیک شرکتونه یې وهڅول چې پدې برخه کې ډیره پانګونه وکړي.

د ۲۰۲۴ کال په پای کې د سورا د محصول د ځنډېدو او د کاروونکو د اوسط بیاکتنو سره، دا د بازار تمې پوره کولو کې پاتې راغی، چې نورو لوبغاړو ته یې د بازار نیولو فرصت ورکړ.

اوس، لکه څنګه چې تولیدي ویډیو دوهمې نیمایي ته ننوځي، یوازې درې شرکتونه په ریښتیا سره تخنیکي ځواک او پراختیایي ظرفیت ښیې: د مینی میکس هایلو AI، د کوایشو کیلینګ AI، او د بایټ ډانس جیمینګ AI.

د یو سټارټ اپ په توګه چې یوازې درې کاله وړاندې تاسیس شو، مینی میکس داسې محصولات او ټیکنالوژي راوړې چې کولی شي د خپل ټیټ سټارټ اپ اندازې سره په لوړه کچه سیالي وکړي. د دسمبر 2 کې د I01V-2023-ژوند انځور څخه ویډیو ماډل څخه تر نوي S2V-01 ماډل پورې، دوی د تیرو ویډیو نسل ننګونې حل کوي.

لکه څنګه چې ټیکنالوژي وده کوي او د غوښتنلیک سناریوګانې پراخیږي، د ویډیو نسل مصنوعي ذهانت به د مینځپانګې جوړولو، فلم تولید، بازار موندنې او مخابراتو کې یو نوی انقلاب رامینځته کړي. دا شرکتونه، چې د چین د ویډیو نسل مصنوعي ذهانت ډګر ترټولو لوړې کچې استازیتوب کوي، نه یوازې د چین بازار رهبري کوي بلکه تمه کیږي چې په نړیواله کچه د نړیوالو لویو شرکتونو سره سیالي وکړي. په ورته وخت کې، د ټیکنالوژیکي نوښت ساتلو پرمهال د محصول ثبات او کنټرول ډاډمن کول به د دې شرکتونو لپاره دوامداره ننګونه وي.

د سرچینې څخه افان

رد کول: پورته ذکر شوي معلومات د ifanr.com لخوا چمتو شوي، د Chovm.com څخه په خپلواکه توګه. Chovm.com د پلورونکي او محصولاتو کیفیت او اعتبار په اړه هیڅ استازیتوب او تضمین نه کوي. Chovm.com په څرګنده توګه د محتوا د کاپي حق پورې اړوند د سرغړونو لپاره هر ډول مسؤلیت ردوي.

د يو پيغام د وتو

ستاسو برېښليک پته به خپره نشي. د اړتیا په پټيو کې په نښه *