Dự án AI của một nhà làm phim không chuyên nghiệp có gì nổi bật so với những bộ phim ngắn thông thường?
Vào tháng 2023 năm XNUMX, Jim, một lập trình viên trong ngành trò chơi điện tử, đã trở thành nghệ sĩ AI.
Đến tháng 2024 năm XNUMX, phim hoạt hình ngắn AI “The Thin Man The Gun The Hotpot” của Jim đã giành Giải Vàng cho phim hoạt hình ngắn hay nhất tại Giải thưởng phim ngắn độc lập.
Đây là một liên hoan phim ngắn quốc tế quan trọng trong thế giới phim độc lập, không dành riêng cho các tác phẩm AI, khiến đây trở thành một thành tựu lớn đối với Jim. Ông phát biểu, "Thật đáng mừng khi ban giám khảo tập trung vào chính câu chuyện, bỏ qua nhãn hiệu AI."

“The Thin Man The Gun The Hotpot” chủ yếu do một mình Jim hoàn thành. Bộ phim dài 10 phút này bao gồm 242 cảnh quay, mất gần ba tháng để thực hiện và cần ít nhất 200 giờ làm việc, trung bình hơn hai giờ mỗi ngày.
Trong suốt quá trình sáng tạo kéo dài 90 ngày, Jim cảm thấy như mình đang trong một cuộc đấu trí với AI, vượt qua giới hạn của nó và tránh những hạn chế của nó. Khi người xem nhận xét, "AI đã bắt đầu tạo hoạt hình", Jim trả lời, "Chính những người sáng tạo thúc đẩy AI tạo hoạt hình".
3 tháng, 10 phút
“The Thin Man The Gun The Hotpot” là một bộ phim tội phạm đen, một thể loại quan trọng trong quá khứ của Hollywood, với cốt truyện bắt nguồn từ văn hóa Trung Quốc. Thuật ngữ “The Thin Man The Gun The Hotpot” xuất phát từ Tây Nam Trung Quốc, ám chỉ những quầy hàng ăn nhỏ mở cửa muộn vào ban đêm.
Nhân vật chính, Hứa Hạ, là một chàng trai trẻ ăn ở một quán ăn ven đường vào đêm khuya. Để trả tiền điều trị bệnh cho cha mình, anh đã đưa ra những lựa chọn phi đạo đức nhưng vẫn duy trì một ranh giới đạo đức bất khả xâm phạm. Cuối cùng, anh bị vướng vào bạo lực và giết người, bị số phận trói buộc.

Thay vì gọi là "hoạt hình AI", thì sẽ chính xác hơn khi nói "The Thin Man The Gun The Hotpot" là hoạt hình được tạo bằng công cụ AI.
AI tạo ra hình ảnh, trong khi các yếu tố khác như kịch bản, biên tập, lồng tiếng, nhạc và hiệu ứng âm thanh được thực hiện thủ công. Văn bản trong hình ảnh được thêm vào trong quá trình hậu kỳ.
Về mặt hình ảnh, Jim theo phong cách “thế hệ AI thuần túy”. “The Thin Man The Gun The Hotpot” không có cảnh quay hành động trực tiếp; nó dựa vào chuyển đổi hình ảnh sang video. Hình ảnh được tạo bởi Midjourney và video được tạo bởi Keling, Pika, Jidream, PixVerse và Runway.
Việc tạo ra AI là không thể đoán trước, nhưng việc kể một câu chuyện mạch lạc bằng AI đòi hỏi sự ổn định. Từ thiết kế nhân vật, Jim đã cân nhắc cách duy trì tính nhất quán của nhân vật.
Jim có hai nguyên tắc cho thiết kế nhân vật. Đầu tiên, diện mạo tổng thể phải đơn giản, có thể mô tả bằng một vài từ khóa. Thứ hai, nhân vật phải có các yếu tố riêng biệt, vì vậy ngay cả khi không hoàn toàn nhất quán, họ vẫn có thể được khán giả nhận ra.
Nhân vật tiêu biểu nhất là Anh Wan và Lý Giai Giai. Anh Wan trọc đầu, mặc đồ thể thao và đeo kính râm; Lý Giai Giai trông giống phụ nữ cổ điển thập niên 90, mặc đồ đỏ với mái tóc gợn sóng.


Ông Zhu trông có vẻ lịch sự, đeo kính, mặc vest và không có râu, không có bất kỳ nét đặc biệt nào, khiến ông trở thành nhân vật được Jim xây dựng lặp đi lặp lại nhiều nhất.
Jim nhận thấy AI dễ dàng tạo ra các nhân vật có vẻ ngoài “giàu có” nhưng lại gặp khó khăn với các nhân vật như ông Zhu, người giàu có nhưng không phải là giới thượng lưu, nguy hiểm nhưng không phải là trùm tội phạm.

“Phim hành động trực tiếp với bộ lọc hoạt hình” là cách Jim mô tả phong cách hoạt hình của mình. Người xem có thể tưởng tượng nó sẽ như thế nào với diễn viên thực sự.
Khi hình ảnh của từng nhân vật được tạo ra thông qua văn bản, nó giống như có ảnh trang phục trong phim. Sau đó, Jim sử dụng những hình ảnh này làm tư liệu, tạo ra nhiều hình ảnh hơn với các góc độ và cảnh khác nhau trong khi vẫn giữ nguyên các nhân vật.
Với đủ hình ảnh, có thể tạo video. Công cụ video AI cập nhật nhanh chóng; “The Thin Man The Gun The Hotpot” sử dụng các phiên bản từ tháng 2024 đến tháng XNUMX năm XNUMX.
Đối với những cảnh quay khó về mặt kỹ thuật, Jim đã thử nghiệm nhiều công cụ video khác nhau. Mỗi công cụ đều có thế mạnh riêng. Jidream, Keling và Pika là những công cụ được sử dụng nhiều nhất.
Vào thời điểm đó, Jidream rất giỏi trong các cảnh quay hành động, Pika giỏi trong các cảnh quay phân cảnh và hoạt hình nói chuyện đơn giản, trong khi Keling có khả năng tổng thể mạnh mẽ, mặc dù đôi khi phức tạp không cần thiết trong các tình huống cụ thể.

Ngay cả với các công cụ hiện đại, nhiều cảnh trong “The Thin Man The Gun The Hotpot” vẫn khó có thể thực hiện một cách tự nhiên. Điều này đòi hỏi phải dựa vào các phương pháp truyền thống.
Ví dụ, khi các nhân vật không hướng trực tiếp về phía trước hoặc trong các cảnh cận cảnh mà AI có thể dễ dàng nhận ra, và khi các hành động, biểu cảm và góc máy quay chuyển động, diễn viên lồng tiếng phải lồng tiếng theo chuyển động môi của video. Jim tin rằng các tính năng mới không nhất thiết hữu ích; các phương pháp cũ, mặc dù có thể vụng về, nhưng đáng tin cậy hơn.
Ngách và Đa dạng
Câu chuyện của “The Thin Man The Gun The Hotpot” lấy bối cảnh tại một thị trấn nhỏ ở phía tây nam Trung Quốc, với các nhân vật nói tiếng Tứ Xuyên, sở thích cá nhân của Jim. Phong cách nghệ thuật của “The Thin Man The Gun The Hotpot” cũng độc đáo, với người xem so sánh nó với một tập phim “Love, Death & Robots”.
Trong công việc của mình trong ngành trò chơi điện tử, Jim đã thấy quá nhiều nội dung tương tự và đã được thử nghiệm.
Sáng tạo dựa trên AI có thể được cá nhân hóa. Các tác phẩm chất lượng cao vẫn đòi hỏi các công ty lớn phải đầu tư nguồn lực đáng kể, nhưng Jim thấy nhiều khả năng hơn trong việc tạo ra "một tác phẩm cơ bản".
Ngay từ khi bắt đầu sử dụng Midjourney, Jim đã rõ ràng rằng anh không muốn tạo ra theo phong cách "chính thống". Là người dùng Midjourney nhiều, anh ấy nhận thức rõ về các phong cách mà AI dễ dàng tạo ra, đây cũng là vùng cấm của anh ấy.

Ông thích những phong cách không dễ nhận biết ngay, mang lại cảm giác cổ điển nhưng không hoàn toàn là hoạt hình lỗi thời - quen thuộc nhưng vẫn mới lạ.
Đối với phong cách nghệ thuật của “The Thin Man The Gun The Hotpot”, Jim đã tham khảo đạo diễn hoạt hình Masaaki Yuasa và họa sĩ truyện tranh Yoshiharu Tsuge.
Đầu tiên, anh sử dụng tính năng Mô tả của Midjourney để hiểu các từ khóa trong phong cách của họ, sau đó liên tục viết lời nhắc, lặp lại nhiều lần để tạo ra hình ảnh đáp ứng yêu cầu của anh.

Thế giới quan của “The Thin Man The Gun The Hotpot” phần lớn bắt nguồn từ các khu vực và yếu tố mà Jim quen thuộc.
Năm 2019, Jim đã xem "The Wild Goose Lake" do Điêu Diệc Nam đạo diễn và Hồ Ca đóng vai chính, và vô cùng ấn tượng với "bối cảnh thực tế với cốt lõi và tính thẩm mỹ đen tối" của phim. Anh nhận ra rằng phim thể loại truyền thống không hề cứng nhắc, và có sức sống mới trong các câu chuyện Trung Quốc.

Năm 2021, Jim bắt đầu viết kịch bản, hình thành nên dàn ý cơ bản của “The Thin Man The Gun The Hotpot”, bao gồm một thị trấn nhỏ, một thanh niên tuyệt vọng và một tình huống khó khăn trong cuộc sống.
Năm 2023, Jim bắt đầu sử dụng Midjourney để học nghệ thuật khái niệm AI.
Tuy nhiên, trước năm 2024, Jim chưa bao giờ nghĩ đến việc thực sự làm một bộ phim AI. Anh ấy tự học nhiếp ảnh, viết kịch bản và quay phim nhưng dừng lại ở đó. Video kể chuyện qua ống kính, nhưng anh ấy không thể tạo ra cảnh quay của riêng mình.
Vào đầu năm 2024, Jim bắt đầu sử dụng một số video AI đầu tiên như Pika và đột nhiên nhận ra rằng cuối cùng anh cũng có thể tạo hoạt ảnh cho các cảnh, điều chỉnh và chỉnh sửa hình ảnh, và kết nối chúng để hoàn thành một bộ phim ngắn. Mong muốn sáng tạo của anh trở nên mạnh mẽ chưa từng có.
Khi đã có đủ tài liệu, đã đến lúc chỉnh sửa, hiệu ứng âm thanh, lồng tiếng và âm nhạc. Jim đào sâu hơn vào quy trình sản xuất phim truyền thống. Anh ấy đã thử nghiệm và học hỏi, dần dần tải lên một số tác phẩm cách điệu, mang dấu ấn cá nhân lên Bilibili.


Phim ngắn AI khác của Jim, “Hard Bop Gunman,” lấy cảm hứng từ phong cách truyện tranh Mỹ cũ và phim câm, sau đó giành giải thưởng ở hạng mục Sáng tạo của cuộc thi video AI trên các nền tảng như 1905 Movie Network và Bilibili.
AI vẫn chưa gây ảnh hưởng đến nhiều ngành công nghiệp, nhưng đối với các nhóm nhỏ và những người sáng tạo cá nhân, chi phí sáng tạo đã trở nên chấp nhận được và nội dung đa dạng có cơ hội được khán giả đón nhận.
Lấy bối cảnh “The Thin Man The Gun The Hotpot” ở vùng Tứ Xuyên-Trùng Khánh, Jim thừa nhận rằng anh đã có phần “cố ý”. Anh đang chứng minh rằng khi tạo ra nội dung ngách, không còn cần phải lo lắng quá nhiều về quan niệm truyền thống là “quá rủi ro”.
Có giới hạn nhưng vẫn độc đáo
Một video dài 10 phút "The Thin Man The Gun The Hotpot" có thể không được coi là video dài trên Bilibili. Nhưng trong cộng đồng AI, 10 phút là độ dài hiếm hoi, chưa kể đến việc "The Thin Man The Gun The Hotpot" kể một câu chuyện hoàn chỉnh.
Để hoàn thành 10 phút này, Jim đã thúc đẩy cả bản thân và AI đến giới hạn.
Các cảnh hành động trong nhà hàng lẩu trong “The Thin Man The Gun The Hotpot” tiêu tốn rất nhiều công sức của Jim, với mỗi cảnh quay được thiết kế, nhưng hiệu ứng cuối cùng chỉ đạt chưa đến 40%.

Jim thừa nhận rằng các cảnh hành động của AI thực sự còn thiếu sót, không có cảm giác tác động và không tuân theo logic vật lý, như đánh vào không khí. Không chỉ các cảnh hành động, mà bất kỳ cảnh quay nào có chuyển động đáng kể, như bóp cổ, ném búa hoặc đập bằng đá, đều khó để AI thực hiện được.
Theo kinh nghiệm của Jim, nếu bạn phải thiết kế cảnh hành động cho AI, hãy tránh vũ khí lạnh và thay vào đó sử dụng súng ống, vì AI ít nhất có thể mô phỏng việc bắn súng. Bản thân ông đã sử dụng kỹ thuật này, "Cảm ơn những bộ phim Hồng Kông cũ đã giải cứu."
Khi diễn viên thực sự vật lộn với các cảnh hành động, diễn viên đóng thế có thể vào cuộc, nhưng biểu cảm khuôn mặt là kỹ năng cơ bản của diễn viên. Tuy nhiên, đây cũng là điểm yếu của AI, hoặc là diễn quá lố hoặc không biểu lộ cảm xúc.
Vào tháng 2024 năm XNUMX, Runway đã ra mắt tính năng Act-One, tính năng này thúc đẩy các nhân vật AI tạo ra các biểu cảm tương tự dựa trên video biểu diễn của con người thực. Jim coi đây là dấu hiệu cho thấy nếu nhiều sản phẩm ra mắt các tính năng tương tự, thì AI thực sự có một nút thắt trong hiệu suất.

Trong "The Thin Man The Gun The Hotpot", các nhân vật thường xuất hiện trong các cảnh quay cận cảnh và nửa thân, phản ánh điểm yếu của AI: xử lý các cảnh quay với nhiều chủ thể. Khi thiết kế các cảnh quay, Jim cố gắng tránh các cảnh có nhiều người vì anh vẫn chưa tìm ra giải pháp tốt.
Ngay cả khi tạo hình ảnh bằng Midjourney, nếu có nhiều hơn hai người, vấn đề về khuôn mặt có thể phát sinh. Khi được đưa vào tương tác video AI, cảnh quay trở nên hỗn loạn hơn nữa.
Hình ảnh do AI tạo ra có nhiều hạn chế, vì vậy trong quá trình hậu kỳ, Jim sử dụng cận cảnh, cảnh quay tượng trưng và cảnh cắt nhanh để bù đắp cho những thiếu sót về hình ảnh. Hình ảnh động vật lặp lại trong "The Thin Man The Gun The Hotpot" là một ví dụ.

Ẩn dụ và biểu tượng cũng thường được sử dụng trong một số phim đen kinh điển của Mỹ. Vào những năm 1940 và 50, do những hạn chế về mặt kỹ thuật và các quy định như Bộ luật Hays hạn chế hình ảnh bạo lực, tình hình có phần giống với video AI vào năm 2024.
Jim thấy thích thú với sự vang vọng qua nhiều thập kỷ, “Có lẽ những phương pháp lỗi thời lại có hiệu quả trong các bộ phim AI”.
Tuy nhiên, khán giả rất trung thực, họ đưa ra phản hồi như "một bài thuyết trình PowerPoint mượt mà" hoặc "một truyện tranh động được cải tiến". Jim chấp nhận điều này, đó là lý do tại sao anh ấy chọn làm hoạt hình AI.
So với phong cách hoạt hình da mịn, chuyển động kỳ lạ như ngoài đời thực, ít nhất thì hoạt hình "không khiến người xem ngay lập tức nghĩ rằng, ôi, giả quá". Những chuyển động hơi cứng nhắc và cứng nhắc của nhân vật được chấp nhận nhiều hơn trong hoạt hình phi thực tế.

Không mù quáng theo đuổi độ dài và đảm bảo chất lượng trước tiên một phần là vì Jim so sánh với các bộ phim thông thường. Anh ấy tham gia Giải thưởng phim ngắn độc lập không phải AI để khiến ban giám khảo bỏ qua nhãn hiệu AI và tập trung vào chính câu chuyện.
Jim hy vọng khi xem tác phẩm của mình, khán giả có thể nhận thức được sự hiện diện của AI nhưng không vì AI mà tìm đến, không tỏ ra khoan nhượng trong hệ thống đánh giá phim AI, “Cộng đồng AI quá thân thiện, phải nghe một số lời lẽ gay gắt”.
Kiên trì sáng tạo để vượt qua sự lo lắng
Tin tức về AI thường viết về "những thay đổi chỉ sau một đêm" và việc tạo ra một bộ phim ngắn trong ba tháng đã là một thời gian dài.
AI tiến triển hàng ngày. Vào năm 2023, Jim có thể theo kịp thông tin AI hàng ngày, nhưng từ đầu năm 2024, việc theo kịp xu hướng trở nên bất khả thi. Anh ấy cũng cảm thấy lo lắng nhưng không mù quáng như nhiều người khác.
Công nghệ rất mạnh mẽ, nhưng con người vẫn còn nhiều việc phải làm. Khó khăn và sự thú vị trong sáng tạo nằm ở chỗ một số vấn đề phải do chính người sáng tạo giải quyết.
Trong "The Wild Goose Lake", có một cảnh đấu súng để lại ấn tượng sâu sắc cho Jim: mọi người nhảy múa trên quảng trường, cảnh sát mặc thường phục đi giày phát sáng, tội phạm nổ súng, cảnh sát rượt đuổi với máu phát sáng, rồi cũng nổ súng.

Sự tương phản căng thẳng nhưng vui tươi đã làm Jim cảm động. Nếu không có cảnh này, phản ứng đầu tiên đối với điệu nhảy vuông sẽ là "kém sang".
Ông tin rằng nhiều khi, những yếu tố quen thuộc không phải là lỗi thời nhưng lại thiếu sự khai thác sâu sắc từ người sáng tạo.
Ngược lại, những thứ được diễn đạt cẩn thận bằng các công cụ cũ có thể không được thay thế bằng công nghệ mới.
Các video AI đã được cập nhật nhiều lần, nhưng Jim không có kế hoạch làm lại các phim ngắn AI trước đó.
Thiết kế và sự thỏa hiệp của toàn bộ phim ngắn dựa trên những hạn chế của AI tại thời điểm đó, tạo thành một thực thể hoàn chỉnh. Ngay cả nhiều năm sau, vẫn có những khía cạnh thú vị, đó là nơi giá trị của tác phẩm nằm ở đó.
AI có thể giúp Jim hoàn thành nhiều thí nghiệm tương tự hơn, suy nghĩ lại về những điều thú vị. Anh ấy không thích AI trực tiếp cung cấp câu trả lời; anh ấy thích tự mình giải quyết vấn đề, sử dụng AI như một công cụ tương tự như máy tính.

So với việc sử dụng AI để tạo ra quảng cáo hoặc video ca nhạc, Jim vẫn thích sử dụng AI để kể chuyện. Đối với anh, “lời kể chuyện là ý định ban đầu của việc sáng tạo phim”.
Vài năm trước, khi Jim tự học viết kịch bản, anh không chỉ đọc sách mà còn thực hành bằng cách viết kịch bản và hoàn thành chúng, “Nếu bạn không hoàn thành, điều đó chẳng có ý nghĩa gì”.
Đồng thời, anh ấy xem nhiều phim, liên tục xem những phim mới, sắp xếp các cảnh quay thú vị và xem những lời giải thích và phân tích của người khác. Anh ấy nói rằng anh ấy "không có nền tảng vững chắc", nhưng anh ấy nhạy cảm với hình ảnh, giỏi kết nối các vật thể tương tự và giỏi sử dụng ngôn ngữ máy quay để truyền tải chính xác cảm xúc và cảm giác.

Bây giờ, Jim đang nghỉ ngơi, lên kế hoạch chia sẻ các sáng tạo AI, ấp ủ dự án AI tiếp theo và cập nhật những phát triển mới nhất trong từng công cụ video AI. Theo quan điểm của anh, bất kể có bao nhiêu công cụ AI, thì nguồn lực mà mỗi người có thể đầu tư đều như nhau và không thể thiếu. Số lượng không quan trọng; tìm ra con đường phù hợp cho bản thân mới quan trọng hơn.
Trong phần bình luận Bilibili của Jim, một người xem đã mô tả trải nghiệm xem của họ là "những công cụ vô hồn, sự sáng tạo đầy tâm hồn". Ông trả lời, "Câu nói này có sức nặng rất lớn".
Cách tốt nhất để chống lại sự lo lắng là sáng tạo. Jim không muốn suy đoán về những gì AI có thể làm trong tương lai hoặc nó sẽ thay thế ai. Anh ấy thích tin rằng việc liên tục tạo ra những tác phẩm mới trong tay mình là pháo đài vững chắc của một người.
Nguồn từ ifan
Tuyên bố miễn trừ trách nhiệm: Thông tin nêu trên được cung cấp bởi ifanr.com, độc lập với Chovm.com. Chovm.com không tuyên bố và bảo đảm về chất lượng và độ tin cậy của người bán và sản phẩm. Chovm.com từ chối mọi trách nhiệm pháp lý đối với các vi phạm liên quan đến bản quyền nội dung.