"കണവ കളി" കണ്ടിട്ട് തൃപ്തനായില്ലേ? നിങ്ങളുടെ സ്വന്തം അവസാനം സൃഷ്ടിക്കൂ.


“ഡ്യൂൺ മൂന്നാം ഭാഗത്തിനായി” കാത്തിരിക്കാൻ വയ്യേ? നിങ്ങളുടെ സ്വന്തം പതിപ്പ് ഉണ്ടാക്കൂ.

മുമ്പ്, കഥാപാത്രങ്ങളുടെ സ്ഥിരത നിലനിർത്തുന്നതിന് ഗണ്യമായ സമയം ആവശ്യമായിരുന്നു. ഇപ്പോൾ, ഒരു സ്ക്രീൻഷോട്ട് മാത്രം ഉപയോഗിച്ച്, AI-ക്ക് സിനിമകൾ നിർമ്മിക്കാൻ തുടങ്ങാം.
പുതിയ S2V-01 മോഡൽ നൽകുന്ന Conch AI യുടെ "സബ്ജക്റ്റ് റഫറൻസ്" സവിശേഷതയാണ് ഇതിന് കാരണം. അപ്ലോഡ് ചെയ്ത ചിത്രങ്ങളിലെ വിഷയത്തെ ഇത് കൃത്യമായി തിരിച്ചറിയുകയും ജനറേറ്റ് ചെയ്ത വീഡിയോകളിലെ കഥാപാത്രമായി അതിനെ സജ്ജമാക്കുകയും ചെയ്യുന്നു. ബാക്കിയുള്ളത് ലളിതമാണ്: അടിസ്ഥാന നിർദ്ദേശങ്ങളോടെ സ്വതന്ത്രമായി സൃഷ്ടിക്കുക.


"വിഷയ റഫറൻസ്" സവിശേഷതയുടെ പ്രയോജനങ്ങൾ
പല കമ്പനികളും "സബ്ജക്റ്റ് റഫറൻസ്" സവിശേഷതകൾ വികസിപ്പിച്ചുകൊണ്ടിരിക്കുന്നു, എന്നാൽ സ്ഥിരതയുടെയും യോജിപ്പിന്റെയും വെല്ലുവിളികളെ നേരിടാൻ എല്ലാവർക്കും കഴിയില്ല, പ്രത്യേകിച്ച് ചലനത്തിലെ സ്ഥിരത നിലനിർത്താൻ.
മറ്റുള്ളവയ്ക്ക് ബുദ്ധിമുട്ടുണ്ടാകാമെങ്കിലും, കോഞ്ച് AI മികച്ചതാണ്. ഒരു ഇമേജ് കൊണ്ട്, അത് സ്വഭാവ സവിശേഷതകൾ കൃത്യമായി മനസ്സിലാക്കുകയും, അവയെ വിഷയങ്ങളായി തിരിച്ചറിയുകയും, വിവിധ രംഗങ്ങളിൽ സ്ഥാപിക്കുകയും ചെയ്യുന്നു.
ഒരു നിമിഷം സ്പൈഡർമാൻ ലോകത്തെ രക്ഷിക്കുന്നു, അടുത്ത നിമിഷം അവൻ ഒരു മോട്ടോർ സൈക്കിളിൽ സഞ്ചരിക്കുന്നു.


"ഗെയിം ഓഫ് ത്രോൺസിൽ" ഡ്രാഗണുകളെ പരിശീലിപ്പിക്കേണ്ട മദർ ഓഫ് ഡ്രാഗൺസ് ഇപ്പോൾ ഒരു കൊച്ചു ചെന്നായയുമായി കളിക്കുകയാണ്.


സൃഷ്ടിപരമായ സ്വാതന്ത്ര്യത്തിനും വിശ്വസ്തതയ്ക്കും ഇടയിലുള്ള ഒരു സന്തുലിതാവസ്ഥ കൈവരിക്കുന്നതിലാണ് “വിഷയ റഫറൻസിലെ” വഴിത്തിരിവ്. ഇത് സ്രഷ്ടാക്കൾക്ക് ഒരു “സാർവത്രിക നടനെ” നൽകുന്നത് പോലെയാണ്, അദ്ദേഹത്തിന്റെ രൂപം വികലമാകില്ല, പക്ഷേ സ്വാഭാവികമായും പ്രവർത്തനങ്ങളും പോസുകളും അനുസരിച്ച് മാറുന്നു, സംവിധായകന്റെ ആവശ്യാനുസരണം ഏത് രംഗത്തിലും ഏത് ആക്ഷനും അവതരിപ്പിക്കുന്നു.
വെറുമൊരു പുതിയ സവിശേഷതയല്ല, മറിച്ച് ഒരു അതുല്യമായ സാങ്കേതിക പരിഹാരം
ടെക്സ്റ്റ്-ടു-ഇമേജ് അല്ലെങ്കിൽ ഇമേജ്-ടു-ഇമേജ് ജനറേഷനുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ വ്യത്യസ്ത സാങ്കേതിക വെല്ലുവിളികളും ആവശ്യകതകളും ഉള്ള, സബ്ജക്റ്റ് റഫറൻസ് വ്യത്യസ്തമായ ഒരു പ്രവർത്തനമാണെന്ന് യഥാർത്ഥ പരീക്ഷണ അനുഭവം കാണിക്കുന്നു.
പരമ്പരാഗത ഇമേജ്-ടു-വീഡിയോ ജനറേഷൻ സ്റ്റാറ്റിക് ഇമേജുകളെ മാത്രമേ ആനിമേറ്റ് ചെയ്യുന്നുള്ളൂ, പ്രധാനമായും ഭാഗികമായ പരിഷ്കാരങ്ങളോടെ. ഉദാഹരണത്തിന്, സോങ് ഹൈ-ക്യോയുടെ ഈ സ്റ്റില്ലിൽ, ഇമേജ്-ടു-വീഡിയോ സ്റ്റാറ്റിക് ഇമേജിനെ പരിമിതമായ ശ്രേണിയും കാര്യമായ ചലനങ്ങളുമില്ലാത്ത ഒരു ഡൈനാമിക് ഇമേജാക്കി മാറ്റുന്നു.


അതേ ഫോട്ടോ ഉപയോഗിച്ച്, "വിഷയ റഫറൻസിന്" ടെക്സ്റ്റ് പ്രോംപ്റ്റുകളെ അടിസ്ഥാനമാക്കി ഒരു പൂർണ്ണ സെഗ്മെന്റ് സൃഷ്ടിക്കാൻ കഴിയും, ഇത് സ്ഥിരമായ മുഖ സവിശേഷതകൾ നിലനിർത്തിക്കൊണ്ട് സ്വതന്ത്ര ചലനം അനുവദിക്കുന്നു.

ഒരു വിഷയവുമായി വീഡിയോകൾ സൃഷ്ടിക്കുന്നതിന് നിലവിൽ രണ്ട് സാങ്കേതിക മാർഗങ്ങളുണ്ട്. ഒന്ന് ലോറ സാങ്കേതികവിദ്യയെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്, ഇത് മുൻകൂട്ടി പരിശീലിപ്പിച്ച വലിയ ജനറേറ്റീവ് മോഡലുകളെ മികച്ചതാക്കുന്നു. പുതിയ വീഡിയോകൾ സൃഷ്ടിക്കുമ്പോൾ ലോറയ്ക്ക് ഗണ്യമായ കണക്കുകൂട്ടൽ ആവശ്യമാണ്, ഇത് ഉപയോക്താക്കൾക്ക് ഒരേ വിഷയത്തിന്റെ ഒന്നിലധികം കോണുകൾ അപ്ലോഡ് ചെയ്യേണ്ടതുണ്ട്, ഗുണനിലവാരം ഉറപ്പാക്കാൻ ഓരോ സെഗ്മെന്റിനും വ്യത്യസ്ത ഘടകങ്ങൾ പോലും വ്യക്തമാക്കേണ്ടതുണ്ട്. ഇത് നിരവധി ടോക്കണുകളും ഉപയോഗിക്കുകയും ദീർഘനേരം കാത്തിരിക്കുകയും വേണം.
വിപുലമായ സാങ്കേതിക പര്യവേക്ഷണത്തിന് ശേഷം, ഇമേജ് റഫറൻസിനെ അടിസ്ഥാനമാക്കി മിനിമാക്സ് ഒരു റൂട്ട് തിരഞ്ഞെടുത്തു: ഫിസിക്കൽ ഷൂട്ടിംഗിന്റെ സൃഷ്ടിപരമായ യുക്തിയുമായി യോജിപ്പിച്ച്, ചിത്രങ്ങളിൽ ഏറ്റവും കൃത്യമായ ദൃശ്യ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ഈ റൂട്ടിൽ, ചിത്രത്തിലെ നായകൻ തിരിച്ചറിയലിനായി മോഡലിന്റെ മുൻഗണനയാണ് - തുടർന്നുള്ള രംഗങ്ങളോ പ്ലോട്ടോ പരിഗണിക്കാതെ, വിഷയം സ്ഥിരത പുലർത്തണം.
മറ്റ് ദൃശ്യ വിവരങ്ങൾ കൂടുതൽ തുറന്നതും ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ വഴി നിയന്ത്രിക്കപ്പെടുന്നതുമാണ്. ഈ സമീപനം "കൃത്യമായ പുനരുൽപാദനം + ഉയർന്ന സ്വാതന്ത്ര്യം" എന്ന ലക്ഷ്യം കൈവരിക്കുന്നു.


ഈ വീഡിയോയിൽ, ഡ്രാഗൺ ക്വീനിന്റെ ഒരു ചിത്രം മാത്രമേ മോഡലിന് നൽകിയിട്ടുള്ളൂ. അവസാനം ജനറേറ്റ് ചെയ്ത വീഡിയോ, പ്രോംപ്റ്റിൽ പരാമർശിച്ചിരിക്കുന്ന ക്യാമറ ഭാഷയും ദൃശ്യ ഘടകങ്ങളും കൃത്യമായി അവതരിപ്പിച്ചു, ഇത് ശക്തമായ ധാരണ പ്രകടമാക്കുന്നു.
LoRA സൊല്യൂഷനുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, ഈ സാങ്കേതിക സമീപനം ഉപയോക്താക്കൾക്ക് അപ്ലോഡ് ചെയ്യേണ്ട മെറ്റീരിയലിന്റെ അളവ് ഗണ്യമായി കുറയ്ക്കുകയും ഡസൻ കണക്കിന് വീഡിയോ സെഗ്മെന്റുകളെ ഒരൊറ്റ ചിത്രമാക്കി മാറ്റുകയും ചെയ്യുന്നു. കാത്തിരിപ്പ് സമയം സെക്കൻഡുകൾക്കുള്ളിൽ അളക്കുന്നു, ടെക്സ്റ്റ് അല്ലെങ്കിൽ ഇമേജുകൾ സൃഷ്ടിക്കാൻ എടുക്കുന്ന സമയത്തിന് സമാനമാണ് - ഇമേജ്-ടു-വീഡിയോയുടെ കൃത്യതയും ടെക്സ്റ്റ്-ടു-വീഡിയോയുടെ സ്വാതന്ത്ര്യവും സംയോജിപ്പിക്കുന്നു.
ചൈനീസ് നിർമ്മാണത്തിന്റെ സവിശേഷതകൾ, നിങ്ങളുടെ ഒന്നിലധികം ആവശ്യങ്ങൾ നിറവേറ്റൽ
ഒന്നിലധികം ആവശ്യങ്ങൾ അമിതമായ ഒരു ആവശ്യകതയല്ല. കൃത്യവും സ്ഥിരതയുള്ളതുമായ കഥാപാത്ര ഇമേജുകളും സ്വതന്ത്ര ചലനവും ഒരേസമയം നേടിയെടുക്കുന്നതിലൂടെ മാത്രമേ മോഡലിന് ലളിതമായ വിനോദ ഉപയോഗങ്ങളെ മറികടക്കാനും വ്യവസായ ആപ്ലിക്കേഷനുകളിൽ വിശാലമായ മൂല്യം നേടാനും കഴിയൂ.
ഉദാഹരണത്തിന്, ഉൽപ്പന്ന പരസ്യങ്ങളിൽ, ഒരു മോഡൽ ഇമേജിൽ നിന്ന് തന്നെ പ്രോംപ്റ്റ് വാക്കുകൾ മാറ്റി വിവിധ ഉൽപ്പന്ന വീഡിയോകൾ നേരിട്ട് സൃഷ്ടിക്കാൻ കഴിയും.


ഇമേജ്-ടു-വീഡിയോ രീതികൾ ഉപയോഗിക്കുകയാണെങ്കിൽ, നിലവിലുള്ള മുഖ്യധാരാ പരിഹാരം ആദ്യത്തേയും അവസാനത്തേയും ഫ്രെയിമുകൾ സജ്ജമാക്കുക എന്നതാണ്, നിലവിലുള്ള ചിത്രങ്ങളാൽ ഇഫക്റ്റ് പരിമിതപ്പെടുത്തുക എന്നതാണ്. വ്യത്യസ്ത കോണുകൾ ശേഖരിച്ച്, ഷോട്ടുകളുടെ ഒരു ശ്രേണി പൂർത്തിയാക്കുന്നതിന് മെറ്റീരിയലുകൾ ഒരുമിച്ച് ചേർക്കുന്നതിന് ആവർത്തിച്ചുള്ള ശ്രമങ്ങളും ഇതിന് ആവശ്യമാണ്.
വീഡിയോ നിർമ്മാണ വർക്ക്ഫ്ലോയ്ക്ക് കൂടുതൽ അനുയോജ്യമാക്കുന്നതിന് വ്യത്യസ്ത സാങ്കേതികവിദ്യകളുടെ സവിശേഷതകൾ സംയോജിപ്പിക്കുന്നതാണ് "വിഷയ റഫറൻസിന്റെ" ഗുണം. ഭാവിയിൽ, 80%-ത്തിലധികം മാർക്കറ്റിംഗ് പ്രൊഫഷണലുകളും വിവിധ ഘട്ടങ്ങളിൽ ജനറേറ്റീവ് ഉപകരണങ്ങൾ ഉപയോഗിക്കും, കഥയിലും പ്ലോട്ട് സങ്കൽപ്പത്തിലും മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കും, അങ്ങനെ അവരുടെ കൈകൾ സ്വതന്ത്രമാകും.
സ്റ്റാറ്റിസ്റ്റയുടെ അഭിപ്രായത്തിൽ, പരസ്യത്തിലും മാർക്കറ്റിംഗിലും ജനറേറ്റീവ് AI ഉൽപ്പന്നങ്ങളുടെ വിപണി വലുപ്പം 15 ൽ 2021 ബില്യൺ ഡോളർ കവിഞ്ഞു. 2028 ആകുമ്പോഴേക്കും ഈ സംഖ്യ 107.5 ബില്യൺ ഡോളറിലെത്തും. മുൻ വർക്ക്ഫ്ലോകളിൽ, ശുദ്ധമായ ടെക്സ്റ്റ്-ടു-വീഡിയോയ്ക്ക് വളരെയധികം നിയന്ത്രണാതീതമായ ഘടകങ്ങൾ ഉണ്ടായിരുന്നു, സൃഷ്ടിയുടെ പ്രാരംഭ ഘട്ടങ്ങൾക്ക് അനുയോജ്യമാണ്. യൂറോപ്യൻ, അമേരിക്കൻ പരസ്യ, മാർക്കറ്റിംഗ് വ്യവസായങ്ങളിൽ, ജനറേറ്റീവ് AI ഇതിനകം തന്നെ വളരെ സാധാരണമാണ്, 52% ഉപയോഗ കേസുകളും ഡ്രാഫ്റ്റുകൾക്കും ആസൂത്രണത്തിനും 48% ബ്രെയിൻസ്റ്റോമിംഗിനുമാണ്.
നിലവിൽ, ഹൈലുവോ AI ആദ്യം ഒരു കഥാപാത്രത്തിനായുള്ള റഫറൻസ് ശേഷി തുറക്കുന്നു. ഭാവിയിൽ, ഇത് ഒന്നിലധികം കഥാപാത്രങ്ങളിലേക്കും, വസ്തുക്കളിലേക്കും, രംഗങ്ങളിലേക്കും, അതിലേറെയിലേക്കും വികസിക്കും, ഹൈലുവോയുടെ മുദ്രാവാക്യമായ "എല്ലാ ആശയങ്ങളും ഒരു ബ്ലോക്ക്ബസ്റ്ററാണ്" എന്നതിൽ നിർദ്ദേശിച്ചതുപോലെ, സർഗ്ഗാത്മകതയെ കൂടുതൽ അഴിച്ചുവിടും.
2023 ഓഗസ്റ്റിൽ മിനിമാക്സ് വീഡിയോ മോഡൽ പുറത്തിറക്കിയതിനുശേഷം, സൃഷ്ടിച്ച ചിത്രങ്ങളുടെ ഗുണനിലവാരവും സുഗമതയും മുതൽ സ്ഥിരതയും സ്ഥിരതയും വരെ അന്താരാഷ്ട്രതലത്തിൽ നിരവധി ഉപയോക്താക്കളെ ഇത് തുടർച്ചയായി ആകർഷിച്ചു, ധാരാളം പോസിറ്റീവ് ഫീഡ്ബാക്കും പ്രൊഫഷണൽ അംഗീകാരവും ലഭിച്ചു.


കഴിഞ്ഞ വർഷത്തെ സാങ്കേതിക മത്സരത്തിൽ, AI വീഡിയോ ജനറേഷൻ മേഖലയിലെ മത്സരാധിഷ്ഠിതമായ ഒരു അന്തരീക്ഷം ഉയർന്നുവന്നിരുന്നു. സോറയുടെ നടപ്പാക്കൽ വീഡിയോ ജനറേഷന്റെ സാധ്യതകൾ കാണിച്ചുതന്നു, ഇത് പ്രമുഖ ടെക് കമ്പനികളെ ഈ മേഖലയിൽ വൻതോതിൽ നിക്ഷേപം നടത്താൻ പ്രേരിപ്പിച്ചു.
2024 അവസാനത്തോടെ സോറയുടെ ഉൽപ്പന്നം ലോഞ്ച് ചെയ്യാൻ വൈകിയതും ശരാശരി ഉപയോക്തൃ അവലോകനങ്ങളും കാരണം, വിപണി പ്രതീക്ഷകൾ നിറവേറ്റുന്നതിൽ അത് പരാജയപ്പെട്ടു, ഇത് മറ്റ് കളിക്കാർക്ക് വിപണി പിടിച്ചെടുക്കാൻ അവസരം നൽകി.
ഇപ്പോൾ, ജനറേറ്റീവ് വീഡിയോ രണ്ടാം പകുതിയിലേക്ക് കടക്കുമ്പോൾ, മൂന്ന് കമ്പനികൾ മാത്രമേ സാങ്കേതിക ശക്തിയും വികസന സാധ്യതയും പ്രകടിപ്പിക്കുന്നുള്ളൂ: മിനിമാക്സിന്റെ ഹൈലുവോ AI, കുയിഷോവിന്റെ കെലിംഗ് AI, ബൈറ്റ്ഡാൻസിന്റെ ജിമെങ് AI.
മൂന്ന് വർഷം മുമ്പ് സ്ഥാപിതമായ ഒരു സ്റ്റാർട്ടപ്പ് എന്ന നിലയിൽ, മിനിമാക്സ് അതിന്റെ മെലിഞ്ഞ സ്റ്റാർട്ടപ്പ് വലുപ്പം ഉപയോഗിച്ച് ഉയർന്ന തലത്തിൽ മത്സരിക്കാൻ കഴിയുന്ന ഉൽപ്പന്നങ്ങളും സാങ്കേതികവിദ്യയും കൊണ്ടുവന്നു. 2 ഡിസംബറിൽ I01V-2023-ലൈവ് ഇമേജ്-ടു-വീഡിയോ മോഡൽ മുതൽ പുതിയ S2V-01 മോഡൽ വരെ, മുൻ വീഡിയോ ജനറേഷന്റെ വെല്ലുവിളികൾ അവർ പരിഹരിച്ചുവരികയാണ്.
സാങ്കേതികവിദ്യ പക്വത പ്രാപിക്കുകയും ആപ്ലിക്കേഷൻ സാഹചര്യങ്ങൾ വികസിക്കുകയും ചെയ്യുമ്പോൾ, വീഡിയോ ജനറേഷൻ AI ഉള്ളടക്ക നിർമ്മാണം, ചലച്ചിത്ര നിർമ്മാണം, മാർക്കറ്റിംഗ്, ആശയവിനിമയം എന്നിവയിൽ ഒരു പുതിയ വിപ്ലവത്തിന് തുടക്കമിടും. ചൈനയുടെ വീഡിയോ ജനറേഷൻ AI മേഖലയിലെ ഏറ്റവും ഉയർന്ന തലത്തെ പ്രതിനിധീകരിക്കുന്ന ഈ കമ്പനികൾ ചൈനീസ് വിപണിയെ നയിക്കുക മാത്രമല്ല, അന്താരാഷ്ട്ര ഭീമന്മാരുമായി ആഗോളതലത്തിൽ മത്സരിക്കുമെന്നും പ്രതീക്ഷിക്കുന്നു. അതേസമയം, സാങ്കേതിക നവീകരണം നിലനിർത്തിക്കൊണ്ട് ഉൽപ്പന്ന സ്ഥിരതയും നിയന്ത്രണക്ഷമതയും ഉറപ്പാക്കുന്നത് ഈ സംരംഭങ്ങൾക്ക് തുടർച്ചയായ വെല്ലുവിളിയായിരിക്കും.
ഉറവിടം ഇഫാൻ
നിരാകരണം: മുകളിൽ നൽകിയിരിക്കുന്ന വിവരങ്ങൾ Chovm.com-ൽ നിന്ന് സ്വതന്ത്രമായി ifanr.com ആണ് നൽകുന്നത്. വിൽപ്പനക്കാരന്റെയും ഉൽപ്പന്നങ്ങളുടെയും ഗുണനിലവാരവും വിശ്വാസ്യതയും സംബന്ധിച്ച് Chovm.com യാതൊരു പ്രാതിനിധ്യവും വാറന്റിയും നൽകുന്നില്ല. ഉള്ളടക്കത്തിന്റെ പകർപ്പവകാശ ലംഘനങ്ങൾക്കുള്ള ഏതൊരു ബാധ്യതയും Chovm.com വ്യക്തമായി നിരാകരിക്കുന്നു.