In che modo il progetto di intelligenza artificiale di un regista non professionista si è distinto tra i normali cortometraggi?
Nel febbraio 2023, Jim, programmatore nel settore dei videogiochi, è diventato un artista dell'intelligenza artificiale.
Nel dicembre 2024, il cortometraggio animato AI di Jim "The Thin Man The Gun The Hotpot" ha vinto il premio Gold Award per il miglior cortometraggio animato agli Independent Shorts Awards.
Si tratta di un importante festival internazionale di cortometraggi nel mondo del cinema indipendente, non specificamente per le opere di IA, il che lo rende un risultato importante per Jim. Ha affermato: "È gratificante che i giudici si siano concentrati sulla storia in sé, ignorando l'etichetta di IA".
"The Thin Man The Gun The Hotpot" è stato completato principalmente da Jim da solo. Il film di 10 minuti è composto da 242 scene, ha richiesto quasi tre mesi di lavorazione e almeno 200 ore di lavoro, con una media di oltre due ore al giorno.
Durante il processo di creazione durato 90 giorni, Jim si è sentito come se fosse impegnato in una battaglia di ingegno con l'IA, spingendone i limiti ed evitandone i vincoli. Quando gli spettatori hanno commentato: "L'IA ha iniziato a creare animazioni", Jim ha risposto: "Sono i creatori che guidano l'IA a creare animazioni".
3 mesi, 10 minuti
"The Thin Man The Gun The Hotpot" è un film noir poliziesco, un genere importante nel passato di Hollywood, con una storia radicata nella cultura cinese. Il termine "The Thin Man The Gun The Hotpot" deriva dalla Cina sud-occidentale e si riferisce alle piccole bancarelle di cibo aperte fino a tarda notte.
Il protagonista, Xu Xia, è un giovane che mangia in una bancarella di strada a tarda notte. Per pagare le cure mediche del padre, fa delle scelte non etiche ma mantiene una linea morale intoccabile. Alla fine, rimane invischiato nella violenza e nell'omicidio, intrappolato dal destino.
Piuttosto che chiamarla "animazione AI", è più corretto dire che "The Thin Man The Gun The Hotpot" è un'animazione realizzata utilizzando strumenti di intelligenza artificiale.
L'intelligenza artificiale ha generato le immagini, mentre altri elementi come la sceneggiatura, il montaggio, il doppiaggio, la musica e gli effetti sonori sono stati realizzati manualmente. Il testo nelle immagini è stato aggiunto in post-produzione.
In termini di visual, Jim segue uno stile di "generazione AI pura". "The Thin Man The Gun The Hotpot" non ha riprese live-action; si basa sulla conversione da immagine a video. Le immagini sono state generate da Midjourney e i video da Keling, Pika, Jidream, PixVerse e Runway.
La generazione di AI è imprevedibile, ma raccontare una storia coerente con l'AI richiede stabilità. Dal character design, Jim ha pensato a come mantenere la coerenza dei personaggi.
Jim aveva due principi per il character design. Primo, l'aspetto generale dovrebbe essere semplice, descrivibile con poche parole chiave. Secondo, i personaggi dovrebbero avere elementi distintivi, quindi anche se non del tutto coerenti, rimangono riconoscibili al pubblico.
I personaggi più rappresentativi sono Brother Wan e Li Jiajia. Brother Wan è calvo, indossa abbigliamento sportivo e occhiali da sole; Li Jiajia assomiglia a una donna retrò degli anni '90, vestita di rosso e con i capelli mossi.
L'apparentemente raffinato signor Zhu, che indossa occhiali e un completo senza barba, è privo di caratteristiche insolite, il che lo rende il personaggio più ripetuto da Jim.
Jim ha scoperto che l'intelligenza artificiale genera facilmente personaggi con un'aura da "vecchia ricchezza", ma ha difficoltà con personaggi come il signor Zhu, che è ricco ma non d'élite, pericoloso ma non un boss della malavita.
"Film live-action con filtro di animazione", così Jim descrive il suo stile di animazione. Gli spettatori possono immaginare come apparirebbe con attori veri.
Una volta che l'immagine di ogni personaggio è generata tramite testo, è come avere la foto del costume di un film. Jim usa quindi queste immagini come materiale, generando altre immagini con angolazioni e scene diverse, mantenendo i personaggi invariati.
Con immagini sufficienti, è possibile generare video. Gli strumenti video AI si aggiornano rapidamente; "The Thin Man The Gun The Hotpot" ha utilizzato versioni da agosto a settembre 2024.
Per le riprese tecnicamente impegnative, Jim ha sperimentato vari strumenti video. Ogni strumento ha i suoi punti di forza. Jidream, Keling e Pika sono stati gli strumenti più utilizzati.
All'epoca, Jidream eccelleva nelle riprese d'azione, Pika nelle riprese di scena e nelle semplici animazioni parlate, mentre Keling aveva ottime capacità complessive, anche se a volte risultava inutilmente complesso in situazioni specifiche.
Anche con gli strumenti odierni, molte scene di "The Thin Man The Gun The Hotpot" sono difficili da realizzare in modo naturale. Ciò richiede di affidarsi a metodi tradizionali.
Ad esempio, quando i personaggi non sono rivolti direttamente in avanti o in primi piani che l'IA può riconoscere facilmente, e quando le azioni, le espressioni e le angolazioni della telecamera sono in movimento, un doppiatore deve doppiare in base ai movimenti delle labbra del video. Jim ritiene che le nuove funzionalità non siano necessariamente utili; i vecchi metodi, sebbene forse goffi, sono più affidabili.
Di nicchia e diversificato
La storia di "The Thin Man The Gun The Hotpot" è ambientata in una cittadina nel sud-ovest della Cina, con personaggi che parlano il dialetto del Sichuan, una preferenza personale di Jim. Anche lo stile artistico di "The Thin Man The Gun The Hotpot" è unico, con gli spettatori che lo paragonano a un episodio di "Love, Death & Robots".
Nel suo lavoro nel settore dei videogiochi, Jim ha visto troppi contenuti simili, già collaudati.
La creazione basata sull'intelligenza artificiale può essere personalizzata. I lavori di alta qualità richiedono ancora alle grandi aziende di investire risorse significative, ma Jim vede più possibilità nella creazione di "un lavoro di base".
Fin dall'inizio dell'utilizzo di Midjourney, Jim aveva ben chiaro che non voleva creare in uno stile "mainstream". Come utente assiduo di Midjourney, è ben consapevole degli stili che l'IA genera facilmente, che sono anche le sue zone vietate.
Preferisce stili non immediatamente riconoscibili, con un tocco retrò ma non del tutto antiquato: familiari ma nuovi.
Per lo stile artistico di "The Thin Man The Gun The Hotpot", Jim ha fatto riferimento al direttore dell'animazione Masaaki Yuasa e al mangaka Yoshiharu Tsuge.
Inizialmente ha utilizzato la funzionalità Describe di Midjourney per comprendere le parole chiave dei loro stili, quindi ha scritto continuamente prompt, ripetendo più volte per generare immagini che soddisfacessero i suoi requisiti.
La visione del mondo di "The Thin Man The Gun The Hotpot" deriva in gran parte dalle regioni e dagli elementi che Jim conosce.
Nel 2019, Jim ha guardato "The Wild Goose Lake" diretto da Diao Yinan e interpretato da Hu Ge, ed è rimasto profondamente colpito dalla sua "ambientazione concreta con un'estetica e un nucleo noir". Si è reso conto che i film di genere tradizionali non sono scolpiti nella pietra e che c'è una nuova vitalità nelle narrazioni cinesi.
Nel 2021, Jim ha iniziato a scrivere la sceneggiatura, delineando la struttura di base di "The Thin Man The Gun The Hotpot", che include una piccola città, un giovane disperato e una situazione di vita difficile.
Nel 2023, Jim ha iniziato a usare Midjourney per apprendere la concept art basata sull'intelligenza artificiale.
Tuttavia, prima del 2024, Jim non aveva mai pensato di realizzare un film di intelligenza artificiale. Aveva imparato da solo la fotografia, la sceneggiatura e la cinematografia, ma si era fermato lì. I video raccontano storie attraverso le lenti, ma non riusciva a creare le sue riprese dal set.
All'inizio del 2024, Jim ha iniziato a usare alcuni dei primi video di intelligenza artificiale come Pika e all'improvviso si è reso conto che poteva finalmente animare scene, adattare e modificare immagini e collegarle per completare un cortometraggio. Il suo desiderio di creare è diventato senza precedenti.
Con i materiali pronti, era tempo di editing, effetti sonori, doppiaggio e musica. Jim si è immerso più a fondo nel tradizionale processo di produzione cinematografica. Ha sperimentato e imparato, caricando gradualmente alcuni lavori stilizzati e personalmente distintivi su Bilibili.
L'altro cortometraggio di Jim sull'intelligenza artificiale, "Hard Bop Gunman", si ispirava allo stile dei vecchi fumetti americani e dei film muti, vincendo in seguito un premio nella sezione Creative Track di un concorso di video sull'intelligenza artificiale su piattaforme come 1905 Movie Network e Bilibili.
L'intelligenza artificiale non ha ancora rivoluzionato molti settori, ma per i piccoli team e i singoli creatori il costo della creazione è diventato accettabile e contenuti diversificati hanno la possibilità di essere visti dal pubblico.
Ambientando "The Thin Man The Gun The Hotpot" nella regione del Sichuan-Chongqing, Jim ammette di essere stato in un certo senso "deliberato". Sta dimostrando che quando si creano contenuti di nicchia, non c'è più bisogno di preoccuparsi troppo della nozione tradizionale di "troppo rischioso".
Limitato, ma unico
Un "The Thin Man The Gun The Hotpot" di 10 minuti potrebbe non essere considerato un video lungo su Bilibili. Ma nella comunità AI, 10 minuti sono una lunghezza rara, per non parlare del fatto che "The Thin Man The Gun The Hotpot" racconta una storia completa.
Per completare questi 10 minuti, Jim ha spinto sia se stesso che l'IA al limite.
Le scene d'azione nel ristorante di hotpot in "The Thin Man The Gun The Hotpot" hanno richiesto molto impegno da parte di Jim, con ogni inquadratura progettata, ma l'effetto finale è stato inferiore al 40%.
Jim ammette che le scene d'azione di AI sono effettivamente carenti, senza alcun senso di impatto e non seguono la logica fisica, come colpire l'aria. Non solo le scene d'azione, ma qualsiasi ripresa con movimento significativo, come soffocare, lanciare un martello o colpire con una pietra, è difficile da realizzare per AI.
Secondo l'esperienza di Jim, se devi progettare scene d'azione per l'IA, evita le armi fredde e usa invece le armi da fuoco, poiché l'IA può almeno simulare lo sparo. Lui stesso ha usato questa tecnica, "Grazie ai vecchi film di Hong Kong per il salvataggio".
Quando i veri attori hanno difficoltà con le scene d'azione, possono intervenire le controfigure, ma le espressioni facciali espressive sono l'abilità di base di un attore. Tuttavia, questo è anche un punto debole per l'IA, che o esagera o non mostra alcuna espressione.
Nell'ottobre 2024, Runway ha lanciato la funzionalità Act-One, che spinge i personaggi AI a fare le stesse espressioni basate su video di performance umane reali. Jim vede questo come un segno che se più prodotti lanciano funzionalità simili, ciò indica che l'AI ha effettivamente un collo di bottiglia nelle prestazioni.
In "The Thin Man The Gun The Hotpot", i personaggi appaiono spesso in primi piani e inquadrature a mezzo busto, riflettendo una debolezza dell'IA: la gestione di inquadrature con più soggetti. Quando progetta inquadrature, Jim cerca di evitare scene con più persone perché non ha ancora trovato una buona soluzione.
Anche quando si generano immagini con Midjourney, se ci sono più di due persone, potrebbero sorgere problemi facciali. Quando si inserisce nelle interazioni video AI, la scena diventa ancora più caotica.
Le immagini generate dall'intelligenza artificiale hanno molte limitazioni, quindi in post-produzione Jim usa primi piani, inquadrature simboliche e tagli rapidi per compensare le carenze visive. Le immagini ricorrenti di animali in "The Thin Man The Gun The Hotpot" ne sono un esempio.
Metafore e simbolismo sono anche comunemente usati in alcuni classici film noir americani. Negli anni '1940 e '50, a causa di limitazioni tecniche e regolamenti come l'Hays Code che limitava le immagini violente, la situazione era in qualche modo simile ai video AI del 2024.
Jim è intrigante per il fatto che il rimando a decenni fa è: "Forse i metodi obsoleti funzionano bene nei film sull'intelligenza artificiale".
Tuttavia, il pubblico è onesto e offre feedback come "una presentazione PowerPoint fluida" o "un fumetto dinamico migliorato". Jim accetta questo, motivo per cui ha scelto di realizzare animazioni AI.
Rispetto allo stile realistico, dalla pelle liscia e dai movimenti inquietanti, l'animazione almeno "non fa pensare immediatamente agli spettatori, wow, questo è troppo finto". I movimenti leggermente rigidi e rigidi dei personaggi sono più accettabili nell'animazione non realistica.
Non perseguire ciecamente la lunghezza e garantire prima la qualità è in parte perché Jim fa paragoni con i film normali. Ha partecipato alla competizione non-AI Independent Shorts Awards per far sì che i giudici trascurassero l'etichetta AI e si concentrassero sulla storia in sé.
Jim spera che guardando il suo lavoro, il pubblico possa rendersi conto della presenza dell'IA ma non avvicinarsi ad essa, non mostrando clemenza nel sistema di valutazione dei film basati sull'IA: "La comunità dell'IA è troppo amichevole, è necessario sentire parole dure".
Persistere nella creazione per superare l'ansia
Le notizie sull'intelligenza artificiale parlano spesso di "cambiamenti repentini" e creare un cortometraggio in tre mesi è già molto tempo.
L'IA progredisce quotidianamente. Nel 2023, Jim riusciva a tenere il passo con le informazioni quotidiane sull'IA, ma dall'inizio del 2024, tenere il passo con le tendenze è diventato impossibile. Si sente anche ansioso, ma non ciecamente, come molti altri.
La tecnologia è potente, ma c'è ancora molto lavoro da fare per gli esseri umani. La difficoltà e l'interesse nella creazione risiedono nel fatto che alcuni problemi devono essere risolti dal creatore stesso.
In "The Wild Goose Lake", c'è una scena di sparatoria che ha lasciato Jim profondamente colpito: la gente balla in una piazza, i poliziotti in borghese indossano scarpe luminose, i criminali sparano, la polizia insegue con il sangue luminoso e poi spara anche lei.
Il contrasto teso ma giocoso ha commosso Jim. Senza questa scena, la prima reazione al ballo quadrato sarebbe stata "di cattivo gusto".
Ritiene che spesso gli elementi familiari non siano obsoleti, ma che manchino di approfondimenti da parte dei creatori.
Al contrario, ciò che è stato espresso con cura con vecchi strumenti potrebbe non essere sostituito dalle nuove tecnologie.
I video sull'intelligenza artificiale sono stati aggiornati molte volte, ma Jim non ha intenzione di rifare i precedenti cortometraggi sull'intelligenza artificiale.
Il design e i compromessi dell'intero cortometraggio si basavano sui limiti dell'IA di allora, formando un'entità completa. Anche anni dopo, ci sono ancora aspetti divertenti, ed è qui che risiede il valore dell'opera.
L'IA può aiutare Jim a completare altri esperimenti simili, ripensando a cose interessanti. Non gli piace che l'IA fornisca direttamente risposte; preferisce risolvere i problemi da solo, usando l'IA come uno strumento simile a una calcolatrice.
Rispetto all'uso dell'IA per generare pubblicità o video musicali, Jim preferisce ancora usare l'IA per raccontare storie. Per lui, "la narrazione è l'intenzione originale della creazione di un film".
Qualche anno fa, quando Jim stava imparando da autodidatta a scrivere sceneggiature, non solo leggeva libri, ma si esercitava anche scrivendo sceneggiature e completandole: "Se non le finisci, non significa molto".
Allo stesso tempo, ha guardato molti film, guardandone costantemente di nuovi, organizzando riprese interessanti e osservando le spiegazioni e le analisi degli altri. Dice di "non avere solide basi", ma è sensibile alle immagini, bravo a collegare oggetti simili e più bravo a usare il linguaggio della telecamera per trasmettere accuratamente emozioni e sentimenti.
Ora, Jim si sta prendendo una pausa, progettando di condividere le creazioni di IA, di elaborare il prossimo progetto di IA e di recuperare gli ultimi sviluppi in ogni strumento video di IA. Secondo lui, non importa quanti strumenti di IA ci siano, le risorse che ogni persona può investire sono uguali e indispensabili. La quantità non conta; trovare la strada giusta per sé è più importante.
Nella sezione commenti di Jim su Bilibili, uno spettatore ha descritto la propria esperienza visiva come "strumenti senz'anima, creazione piena di sentimento". Ha risposto: "Questa affermazione ha molto peso".
Il modo migliore per combattere l'ansia è la creazione. Jim non vuole speculare su cosa l'IA potrà fare in futuro o chi sostituirà. Preferisce credere che creare costantemente nuove opere nelle sue mani sia la solida fortezza di una persona.
Fonte da se uno
Dichiarazione di non responsabilità: le informazioni sopra riportate sono fornite da ifanr.com, indipendentemente da Chovm.com. Chovm.com non rilascia alcuna dichiarazione o garanzia in merito alla qualità e all'affidabilità del venditore e dei prodotti. Chovm.com declina espressamente qualsiasi responsabilità per violazioni relative al diritto d'autore dei contenuti.