Tin tức

AI đã có mặt và đang tạo ra những bộ phim. Hollywood sẵn sàng chưa?

12/01/2023

Scott Mann có một vấn đề: chửi thề quá nhiều.

Nhà biên kịch kiêm đạo diễn này đã dành thời gian sản xuất Fall, bộ phim kinh dị gây chóng mặt của anh kể về những người leo núi đá bị mắc kẹt trên đỉnh tháp truyền hình xa xôi, khuyến khích hai nhân vật chính vui vẻ với cuộc đối thoại của họ. Sự ngẫu hứng đó đã đem đến con số khổng lồ 35 câu chửi “đm” trong phim, đặt nó vững chắc vào lãnh thổ xếp hạng R.

Nhưng khi Lionsgate ký hợp đồng phân phối Fall, hãng phim này muốn một bản phim PG-13. Làm sạch bộ phim có nghĩa là xóa hết những thứ thô tục.

“Làm thế nào được?” ngồi trong căn phòng phỏng vấn ốp kính ở Santa Monica hồi tháng 10 năm 2022, hai tháng sau khi bộ phim ra mắt, Mann nhớ lại. Một con kền kền đạo cụ anh trưng dụng từ trường quay đang đậu ngoài sảnh.

Xét cho cùng, việc quay phim lại rất tốn kém và mất thời gian. Mann giải thích anh đã quay Fall trên một đỉnh núi và phải vật lộn với không chỉ COVID mà còn cả những trận cuồng phong và bão sét. Có lúc, một đàn kiến ​​lửa đã trú ngụ bên trong trường quay bộ phim, lúc khác thì trong một ống kim loại dài hàng trăm foot; khi đoàn làm phim đánh thức chúng, bầy đàn bao trùm phim trường “như một đám mây”.

Fall có lẽ là bộ phim khó nhất mà tôi từng làm,” Mann nói. Liệu anh có thể tránh được phải làm một bản cắt giảm?

Fall có lẽ là bộ phim khó nhất mà tôi từng làm,” Mann nói

Anh nhận ra không chừng giải pháp chính là một dự án mà anh đang phát triển song song với bộ phim: phần mềm thông minh nhân tạo có thể chỉnh sửa cảnh quay khuôn mặt diễn viên sau khi ghi hình chính đã hoàn thành, thay đổi biểu cảm khuôn mặt và cử động miệng của họ một cách liền mạch phù hợp với cuộc đối thoại mới được ghi lại.

Đó tưởng chừng là cách sử dụng đơn giản đối với một công nghệ mà các chuyên gia cho rằng sẵn sàng biến đổi gần như mọi khía cạnh của Hollywood, từ động lực làm việc và mô hình tài chính đến cách khán giả nghĩ cái gì là thật cái gì giả.

Robert Wahl, phó giáo sư khoa học máy tính tại Đại học Concordia, Wisconsin, người đã viết về đạo đức của CGI, cho biết trí tuệ nhân tạo sẽ làm với phim ảnh chuyển động những gì Photoshop đã làm với ảnh tĩnh. “Chúng ta không còn có thể hoàn toàn tin tưởng vào những gì ta nhìn thấy nữa rồi.”

“Bây giờ chúng ta đang bị mắc kẹt trên tòa tháp kỳ quái ngu ngốc này ở giữa hư không kỳ quái!” Virginia Gardner kêu lên với Grace Caroline Currey. Nếu bạn không biết một mạng nơ-ron đã tái tạo lại khuôn mặt của các diễn viên, thì có lẽ bạn sẽ không biết đoạn hội thoại sạch sẽ của họ là bổ sung sau

Một giải pháp phần mềm cho lồng tiếng đáng ngờ

Nếu không có lần hợp tác với Robert De Niro thì Mann còn chưa bước chân vào thế giới phần mềm đâu.

De Niro đã góp mặt trong bộ phim ly kỳ tội phạm năm 2015 của Mann, Heist, và cả hai đã dành rất nhiều thời gian và suy nghĩ về diễn xuất của nam diễn viên nổi tiếng. Nhưng khi đến lúc chuyển thể bộ phim để phát hành ở nước ngoài, Mann nói, anh không hài lòng.

Khi phim được phát hành ở nước ngoài, lời thoại thường được ghi âm lại bằng các ngôn ngữ khác. Quá trình đó, được gọi là “lồng tiếng”, giúp bộ phim có thể tiếp cận được trên toàn thế giới nhưng cũng có thể dẫn đến cảnh tượng khó chịu khi diễn viên mấp máy miệng không khớp với những từ mà họ được cho là đang nói. Một giải pháp điển hình là viết lại đoạn hội thoại để khớp với hình ảnh có sẵn — nhưng, chỉ vì để nói cho khớp, những thay đổi đó hy sinh tầm nhìn ban đầu của nhóm sáng tạo.

Robert De Niro trong Heist, phim ly kỳ tội phạm năm 2015 của Mann

“Tất cả những điều tôi đã thực hiện đúng bản sắc Robert De Niro giờ thay đổi hết. Tôi đã khá là tuyệt vọng,” Mann nói về các bản lồng tiếng.

Phim tiếp theo của anh, Final Score, đào sâu thêm những nỗi thất vọng đó. Mann đã thử quét hình diễn viên của mình để có thể đồng bộ hóa thoại của họ tốt hơn, nhưng quá trình này tỏ ra cực kỳ tốn kém và kết quả cuối cùng trông thật kỳ cục.

Mãi cho đến khi nghiên cứu thêm các giải pháp mới lạ, những người đam mê hiệu ứng hình ảnh mới tìm thấy một tài liệu học thuật năm 2018 phác thảo một giải pháp khả thi: mạng nơ-ron hoặc chương trình máy tính bắt chước cấu trúc của não, tìm cách chuyển biểu cảm khuôn mặt của một diễn viên sang khuôn mặt của người khác.

Bị mê hoặc, Mann đã liên hệ với các tác giả của bài báo và bắt đầu cộng tác với vài người trong số họ về một công cụ “vubbing” thô sơ — tức là lồng tiếng bằng hình ảnh chứ không phải bằng âm thanh. Sự bổ sung sau đó của Nick Lynes, bạn của một người bạn có nền tảng về trò chơi trực tuyến, đã giúp nhóm có chỗ đứng trong lĩnh vực công nghệ.

Flawless xử lý lồng tiếng bằng hình ảnh chứ không phải bằng âm thanh

Hợp lại, các đặc phái viên của ba thế giới rất khác nhau — điện ảnh, khoa học và công nghiệp phần mềm — đã xây dựng nên Flawless, một liên doanh đầu tư làm phim AI có văn phòng ở cả Santa Monica và London.

Nói một cách rất rộng, công nghệ của công ty có thể xác định các mẫu trong âm vị của diễn viên (hoặc âm thanh họ tạo ra) và bản sao (hoặc diện mạo của họ thế nào khi tạo ra những âm thanh đó), sau đó — khi được trình bày với các âm vị mới được ghi lại — cập nhật hình ảnh trên màn hình cho phù hợp. Năm ngoái, tạp chí Time đã coi phần mềm “khớp lồng tiếng phim” của công ty là một trong những phát minh hay nhất năm 2021.

Tuy nhiên, cuộc tranh giành để loại bỏ hàng chục câu chửi thề từ Fall đã đặt ra một câu hỏi có khả năng phân nhánh rộng hơn nhiều: thay vì chỉ thay đổi ngôn ngữ của nhân vật, liệu Flawless có thể thay đổi chính nội dung những gì họ nói không?

“Chúng tôi sáng tạo Flawless để giúp các nhà làm phim kể câu chuyện của họ được chính xác như họ muốn,” Scott Mann, đạo diễn-biên kịch, đồng CEO và đồng sáng lập Flawless

Mann, giờ sống ở Los Angeles, cho biết: “Chúng tôi đến một phòng thu âm ở … Burbank với các nữ diễn viên và nói, ‘Được rồi, đây là lời thoại mới.’ Sau đó, họ cắm âm thanh mới vào phần mềm vubbing để điều chỉnh chuyển động khuôn mặt của diễn viên trên màn hình cho phù hợp.

“Chúng tôi thực hiện các cảnh quay, MPAA duyệt lại và cho phim PG-13, và đó là thứ được đưa vào rạp,” anh nói.

Ngồi trong phòng họp ở Santa Monica vài tuần sau khi bộ phim ra mắt, xung quanh là các áp phích của Blade Runner2001: A Space Odyssey, Mann khoe thành quả với cảnh một trong những nhân vật chính của Fall than vãn về tình trạng khó khăn của họ.

“Bây giờ chúng ta đang bị mắc kẹt trên tòa tháp kỳ quái ngu ngốc này ở giữa hư không kỳ quái!” Virginia Gardner kêu lên với Grace Caroline Currey khi cả hai tụm lại trên một bệ cao chông chênh.

“Chúng tôi sử dụng trí thông minh nhân tạo phát triển những phương cách mới để sáng tạo, tiêu thụ và cung cấp nội dung,” Nick Lynes, đồng CEO và đồng sáng lập Flawless

Một lát sau Mann chạy lại cảnh đó. Nhưng lần này, cuộc đối thoại của Gardner gay gắt hơn rõ rệt: “Bây giờ chúng ta đang mắc kẹt trên tòa tháp chết tiệt ngu ngốc này ở giữa cái chỗ bà nó hư không.”

Phiên bản đầu tiên được phát hành vào tháng 8 ở hơn 1.500 rạp chiếu phim của nước Mỹ. Nhưng phần sau — phần có lời thoại phù hợp với một thủy thủ — là những gì Mann thực sự quay trên đỉnh núi đầy kiến lửa đó. Nếu bạn không biết một mạng nơ-ron đã tái tạo lại khuôn mặt của các diễn viên, thì có lẽ bạn sẽ không biết đoạn hội thoại sạch sẽ của họ là bổ sung sau.

“Bạn không thể phân biệt đâu thực đâu giả,” Mann nói, “đó là điều mấu chốt.”

Đạo đức của việc làm giả

Khi nói đến làm phim, chủ nghĩa hiện thực đó có những lợi ích rõ ràng. Không ai muốn chi tiền cho một thứ trông giống như được tạo ra từ MS Paint.

Digital Domain sử dụng học máy để kết xuất diễn viên trong trường hợp họ không thể tự xuất hiện

Nhưng sự lên ngôi của phần mềm có thể không ngừng thay đổi những gì ai đó dường như đã nói có ý nghĩa quan trọng đối với môi trường truyền thông vốn đã tràn ngập thông tin sai lệch. Rốt cuộc, sản phẩm cốt lõi của Flawless về cơ bản chỉ là một phiên bản hợp pháp hơn của “deep-fakes” hoặc CGI bắt chước khuôn mặt và giọng nói của ai đó.

Không khó tưởng tượng một kẻ nghịch ngợm, thay vì sử dụng những công cụ này để cắt những từ tục tĩu ra khỏi một bộ phim, lại tạo ra một đoạn băng lan truyền Joe Biden tuyên chiến với Nga chẳng hạn. Nội dung khiêu dâm được tạo ra bằng hình ảnh kỹ thuật số của ai đó cũng sẽ trở thành một vấn đề.

Và Flawless không phải là công ty duy nhất hoạt động trong không gian này. Papercup, một công ty tạo ra giọng nói tổng hợp của con người để sử dụng trong lồng tiếng và thuyết minh, nhằm mục đích “làm cho người ta có thể xem được bất kỳ băng hình nào bằng bất kỳ ngôn ngữ nào,” giám đốc điều hành Jesse Shemen nói với Los Angeles Times.

Giám đốc công nghệ Hanno Basse cho biết nền tảng chính của hiệu ứng hình ảnh Digital Domain sử dụng học máy để kết xuất diễn viên trong trường hợp họ không thể tự xuất hiện, chẳng hạn như những cảnh cần diễn viên đóng thế kép.

Anthony Bourdain trong phim tài liệu Roadrunner

Khi những công ty này và các công ty khác ngày càng tự động hóa ngành công nghiệp giải trí, thì ngày càng đầy rẫy câu hỏi về đạo đức.

Hollywood đã tính đến khả năng tái tạo kỹ thuật số các diễn viên đã chết, như với giọng nói của Anthony Bourdain trong phim tài liệu Roadrunner hay Peter Cushing và Carrie Fisher trong các phần Star Wars tiếp theo gần đây. Hồi sinh những người nổi tiếng quá cố trong hình ảnh ba chiều giờ đây cũng có thể thực hiện được.

Cuộc đối thoại bị thay đổi kỹ thuật số “có nguy cơ phương hại thỏa thuận của những người liên quan ban đầu,” Scott Stroud, giám đốc chương trình đạo đức truyền thông của Đại học Texas tại Austin, nói. “Những gì các diễn viên nghĩ rằng họ đang đồng ý thực sự lại không phải là những gì được tạo ra.”

Denver D’Rozario, giáo sư marketing của Đại học Howard, người đã nghiên cứu về phần mềm hồi sinh diễn viên đã chết, cho biết công nghệ này sau khi ra mắt có thể mở ra cơ hội thay đổi việc làm phim mãi mãi.

Carrie Fisher trong Star Wars: The Last Jedi

“Giả sử… trong phim, một anh chàng uống lon Pepsi, và 20 năm nữa bạn nhận được tài trợ từ Coke,” D’Rozario nói. “Bạn có đổi lon Pepsi thành Coke không?” “Thời điểm nào mọi thứ có thể được thay đổi? Thời điểm nào thì có thể tin được?”

Mann cho biết công nghệ của anh có rất nhiều ưu điểm, từ việc phá bỏ rào cản ngôn ngữ và khơi dậy sự đồng cảm xuyên biên giới cho đến giúp các diễn viên không phải đau đầu vì chuyện quay lại cảnh phim. Theo quan điểm của anh, các tình huống như tài trợ Coke trong giả định của D’Rozario chính là những dòng doanh thu mới.

Mann cho biết thêm, Flawless chủ động xây dựng một sản phẩm hỗ trợ thay vì thay thế diễn xuất đích thực của con người.

“Có một cách để sử dụng công nghệ tương tự ngành công nghiệp [hiệu ứng hình ảnh] đã thiết lập, đó là: làm điều đó một cách an toàn, làm đúng, làm hợp pháp, với sự đồng ý của mọi người liên quan,” anh nói.

Công nghệ làm phim AI có thể giúp ích hoặc gây hại cho các diễn viên, tùy theo cách nó được sử dụng

Và công ty đã tham gia “tất cả các hiệp hội lớn” về cách tạo và sử dụng công nghệ này một cách hợp lý, vị đạo diễn nói tiếp.

Đại diện SAG-AFTRA nhấn mạnh rằng công nghệ làm phim AI có thể giúp ích hoặc gây hại cho các diễn viên, tùy theo cách nó được sử dụng.

“Khi không làm được gì nhiều ngoài việc cải thiện mặt kỹ thuật số cho diễn xuất của các thành viên trong hiệp hội, công nghệ chỉ đòi hỏi khả năng đưa ra sự đồng ý sau khi được giải thích và có thể là chi phí bổ sung,” Jeffrey Bennett, cố vấn chung của SAG-AFTRA, cho biết trong một email. “Ở thái cực kia là những công nghệ có thể thay thế màn trình diễn truyền thống hoặc lấy màn trình diễn của các thành viên hiệp hội và tạo ra những màn trình diễn hoàn toàn mới; đối với những điều này, chúng tôi khẳng định rằng diễn viên là đối tượng thương lượng bắt buộc.”

Tốt xấu gì thì con tàu cũng đã rời ga.

Các chuyên gia cho rằng công nghệ AI sẵn sàng biến đổi gần như mọi khía cạnh của Hollywood, từ động lực làm việc và mô hình tài chính đến cách khán giả nghĩ cái gì là thật cái gì giả

Fall hiện đang phát trực tuyến và Mann cho biết những phim khác mà công ty anh tạo ra ra mắt vào Giáng sinh 2022 — mặc dù anh không thể công khai tên chúng.

Nếu bạn xem một bộ phim mùa Noel vừa rồi, không chừng là AI đã giúp tạo ra nó.

Liệu bạn có nhận ra? Và liệu có quan trọng không?

Dịch: © Ngô Bình @Quaivatdienanh.com
Nguồn: Los Angeles Times