Scott Mann có một vấn đề: chửi thề quá nhiều.
Nhà biên kịch kiêm đạo diễn này đã dành thời gian sản xuất
Fall,
bộ phim kinh dị gây chóng mặt của anh kể về những người leo núi đá bị
mắc kẹt trên đỉnh tháp truyền hình xa xôi, khuyến khích hai nhân vật
chính vui vẻ với cuộc đối thoại của họ. Sự ngẫu hứng đó đã đem đến con
số khổng lồ 35 câu chửi “đm” trong phim, đặt nó vững chắc vào lãnh thổ
xếp hạng R.
Nhưng khi Lionsgate ký hợp đồng phân phối
Fall, hãng phim này muốn một bản phim PG-13. Làm sạch bộ phim có nghĩa là xóa hết những thứ thô tục.
“Làm
thế nào được?” ngồi trong căn phòng phỏng vấn ốp kính ở Santa Monica
hồi tháng 10 năm 2022, hai tháng sau khi bộ phim ra mắt, Mann nhớ lại.
Một con kền kền đạo cụ anh trưng dụng từ trường quay đang đậu ngoài
sảnh.
Xét cho cùng, việc quay phim lại rất tốn kém và mất thời gian. Mann giải thích anh đã quay
Fall trên
một đỉnh núi và phải vật lộn với không chỉ COVID mà còn cả những trận
cuồng phong và bão sét. Có lúc, một đàn kiến lửa đã trú ngụ bên trong
trường quay bộ phim, lúc khác thì trong một ống kim loại dài hàng trăm
foot; khi đoàn làm phim đánh thức chúng, bầy đàn bao trùm phim trường
“như một đám mây”.
“
Fall có lẽ là bộ phim khó nhất mà tôi từng làm,” Mann nói. Liệu anh có thể tránh được phải làm một bản cắt giảm?
“Fall có lẽ là bộ phim khó nhất mà tôi từng làm,” Mann nói
|
Anh nhận ra không chừng giải pháp chính là một dự án mà anh đang phát
triển song song với bộ phim: phần mềm thông minh nhân tạo có thể chỉnh
sửa cảnh quay khuôn mặt diễn viên sau khi ghi hình chính đã hoàn thành,
thay đổi biểu cảm khuôn mặt và cử động miệng của họ một cách liền mạch
phù hợp với cuộc đối thoại mới được ghi lại.
Đó tưởng chừng là
cách sử dụng đơn giản đối với một công nghệ mà các chuyên gia cho rằng
sẵn sàng biến đổi gần như mọi khía cạnh của Hollywood, từ động lực làm
việc và mô hình tài chính đến cách khán giả nghĩ cái gì là thật cái gì
giả.
Robert Wahl, phó giáo sư khoa học máy tính tại Đại học
Concordia, Wisconsin, người đã viết về đạo đức của CGI, cho biết trí tuệ
nhân tạo sẽ làm với phim ảnh chuyển động những gì Photoshop đã làm với
ảnh tĩnh. “Chúng ta không còn có thể hoàn toàn tin tưởng vào những gì ta
nhìn thấy nữa rồi.”
“Bây giờ chúng ta đang bị mắc kẹt trên tòa tháp kỳ quái ngu ngốc này
ở giữa hư không kỳ quái!” Virginia Gardner kêu lên với Grace Caroline
Currey. Nếu bạn không biết một mạng nơ-ron đã tái tạo lại khuôn mặt của
các diễn viên, thì có lẽ bạn sẽ không biết đoạn hội thoại sạch sẽ của họ
là bổ sung sau
|
Một giải pháp phần mềm cho lồng tiếng đáng ngờNếu không có lần hợp tác với Robert De Niro thì Mann còn chưa bước chân vào thế giới phần mềm đâu.
De Niro đã góp mặt trong bộ phim ly kỳ tội phạm năm 2015 của Mann,
Heist,
và cả hai đã dành rất nhiều thời gian và suy nghĩ về diễn xuất của nam
diễn viên nổi tiếng. Nhưng khi đến lúc chuyển thể bộ phim để phát hành ở
nước ngoài, Mann nói, anh không hài lòng.
Khi phim được phát
hành ở nước ngoài, lời thoại thường được ghi âm lại bằng các ngôn ngữ
khác. Quá trình đó, được gọi là “lồng tiếng”, giúp bộ phim có thể tiếp
cận được trên toàn thế giới nhưng cũng có thể dẫn đến cảnh tượng khó
chịu khi diễn viên mấp máy miệng không khớp với những từ mà họ được cho
là đang nói. Một giải pháp điển hình là viết lại đoạn hội thoại để khớp
với hình ảnh có sẵn — nhưng, chỉ vì để nói cho khớp, những thay đổi đó
hy sinh tầm nhìn ban đầu của nhóm sáng tạo.
Robert De Niro trong Heist, phim ly kỳ tội phạm năm 2015 của Mann
|
“Tất cả những điều tôi đã thực hiện đúng bản sắc Robert De Niro giờ thay
đổi hết. Tôi đã khá là tuyệt vọng,” Mann nói về các bản lồng tiếng.
Phim tiếp theo của anh,
Final Score,
đào sâu thêm những nỗi thất vọng đó. Mann đã thử quét hình diễn viên
của mình để có thể đồng bộ hóa thoại của họ tốt hơn, nhưng quá trình này
tỏ ra cực kỳ tốn kém và kết quả cuối cùng trông thật kỳ cục.
Mãi
cho đến khi nghiên cứu thêm các giải pháp mới lạ, những người đam mê
hiệu ứng hình ảnh mới tìm thấy một tài liệu học thuật năm 2018 phác thảo
một giải pháp khả thi: mạng nơ-ron hoặc chương trình máy tính bắt chước
cấu trúc của não, tìm cách chuyển biểu cảm khuôn mặt của một diễn viên
sang khuôn mặt của người khác.
Bị mê hoặc, Mann đã liên hệ với
các tác giả của bài báo và bắt đầu cộng tác với vài người trong số họ về
một công cụ “vubbing” thô sơ — tức là lồng tiếng bằng hình ảnh chứ
không phải bằng âm thanh. Sự bổ sung sau đó của Nick Lynes, bạn của một
người bạn có nền tảng về trò chơi trực tuyến, đã giúp nhóm có chỗ đứng
trong lĩnh vực công nghệ.
Flawless xử lý lồng tiếng bằng hình ảnh chứ không phải bằng âm thanh
|
Hợp lại, các đặc phái viên của ba thế giới rất khác nhau — điện ảnh,
khoa học và công nghiệp phần mềm — đã xây dựng nên Flawless, một liên
doanh đầu tư làm phim AI có văn phòng ở cả Santa Monica và London.
Nói
một cách rất rộng, công nghệ của công ty có thể xác định các mẫu trong
âm vị của diễn viên (hoặc âm thanh họ tạo ra) và bản sao (hoặc diện mạo
của họ thế nào khi tạo ra những âm thanh đó), sau đó — khi được trình
bày với các âm vị mới được ghi lại — cập nhật hình ảnh trên màn hình cho
phù hợp. Năm ngoái, tạp chí
Time đã coi phần mềm “khớp lồng tiếng phim” của công ty là một trong những phát minh hay nhất năm 2021.
Tuy nhiên, cuộc tranh giành để loại bỏ hàng chục câu chửi thề từ
Fall đã
đặt ra một câu hỏi có khả năng phân nhánh rộng hơn nhiều: thay vì chỉ
thay đổi ngôn ngữ của nhân vật, liệu Flawless có thể thay đổi chính nội
dung những gì họ nói không?
“Chúng tôi sáng tạo Flawless để giúp các nhà làm phim kể câu chuyện
của họ được chính xác như họ muốn,” Scott Mann, đạo diễn-biên kịch, đồng
CEO và đồng sáng lập Flawless
|
Mann, giờ sống ở Los Angeles, cho biết: “Chúng tôi đến một phòng thu âm ở
… Burbank với các nữ diễn viên và nói, ‘Được rồi, đây là lời thoại
mới.’ Sau đó, họ cắm âm thanh mới vào phần mềm vubbing để điều chỉnh
chuyển động khuôn mặt của diễn viên trên màn hình cho phù hợp.
“Chúng tôi thực hiện các cảnh quay, MPAA duyệt lại và cho phim PG-13, và đó là thứ được đưa vào rạp,” anh nói.
Ngồi trong phòng họp ở Santa Monica vài tuần sau khi bộ phim ra mắt, xung quanh là các áp phích của
Blade Runner và
2001: A Space Odyssey, Mann khoe thành quả với cảnh một trong những nhân vật chính của
Fall than vãn về tình trạng khó khăn của họ.
“Bây
giờ chúng ta đang bị mắc kẹt trên tòa tháp kỳ quái ngu ngốc này ở giữa
hư không kỳ quái!” Virginia Gardner kêu lên với Grace Caroline Currey
khi cả hai tụm lại trên một bệ cao chông chênh.
“Chúng tôi sử dụng trí thông minh nhân tạo phát triển những phương
cách mới để sáng tạo, tiêu thụ và cung cấp nội dung,” Nick Lynes, đồng
CEO và đồng sáng lập Flawless
|
Một lát sau Mann chạy lại cảnh đó. Nhưng lần này, cuộc đối thoại của
Gardner gay gắt hơn rõ rệt: “Bây giờ chúng ta đang mắc kẹt trên tòa tháp
chết tiệt ngu ngốc này ở giữa cái chỗ bà nó hư không.”
Phiên bản
đầu tiên được phát hành vào tháng 8 ở hơn 1.500 rạp chiếu phim của nước
Mỹ. Nhưng phần sau — phần có lời thoại phù hợp với một thủy thủ — là
những gì Mann thực sự quay trên đỉnh núi đầy kiến lửa đó. Nếu bạn không
biết một mạng nơ-ron đã tái tạo lại khuôn mặt của các diễn viên, thì có
lẽ bạn sẽ không biết đoạn hội thoại sạch sẽ của họ là bổ sung sau.
“Bạn không thể phân biệt đâu thực đâu giả,” Mann nói, “đó là điều mấu chốt.”
Đạo đức của việc làm giảKhi
nói đến làm phim, chủ nghĩa hiện thực đó có những lợi ích rõ ràng.
Không ai muốn chi tiền cho một thứ trông giống như được tạo ra từ MS
Paint.
Digital Domain sử dụng học máy để kết xuất diễn viên trong trường hợp họ không thể tự xuất hiện
|
Nhưng sự lên ngôi của phần mềm có thể không ngừng thay đổi những gì ai
đó dường như đã nói có ý nghĩa quan trọng đối với môi trường truyền
thông vốn đã tràn ngập thông tin sai lệch. Rốt cuộc, sản phẩm cốt lõi
của Flawless về cơ bản chỉ là một phiên bản hợp pháp hơn của
“deep-fakes” hoặc CGI bắt chước khuôn mặt và giọng nói của ai đó.
Không
khó tưởng tượng một kẻ nghịch ngợm, thay vì sử dụng những công cụ này
để cắt những từ tục tĩu ra khỏi một bộ phim, lại tạo ra một đoạn băng
lan truyền Joe Biden tuyên chiến với Nga chẳng hạn. Nội dung khiêu dâm
được tạo ra bằng hình ảnh kỹ thuật số của ai đó cũng sẽ trở thành một
vấn đề.
Và Flawless không phải là công ty duy nhất hoạt động
trong không gian này. Papercup, một công ty tạo ra giọng nói tổng hợp
của con người để sử dụng trong lồng tiếng và thuyết minh, nhằm mục đích
“làm cho người ta có thể xem được bất kỳ băng hình nào bằng bất kỳ ngôn
ngữ nào,” giám đốc điều hành Jesse Shemen nói với
Los Angeles Times.
Giám
đốc công nghệ Hanno Basse cho biết nền tảng chính của hiệu ứng hình ảnh
Digital Domain sử dụng học máy để kết xuất diễn viên trong trường hợp
họ không thể tự xuất hiện, chẳng hạn như những cảnh cần diễn viên đóng
thế kép.
Anthony Bourdain trong phim tài liệu Roadrunner
|
Khi những công ty này và các công ty khác ngày càng tự động hóa ngành
công nghiệp giải trí, thì ngày càng đầy rẫy câu hỏi về đạo đức.
Hollywood
đã tính đến khả năng tái tạo kỹ thuật số các diễn viên đã chết, như với
giọng nói của Anthony Bourdain trong phim tài liệu
Roadrunner hay Peter Cushing và Carrie Fisher trong các phần
Star Wars tiếp theo gần đây. Hồi sinh những người nổi tiếng quá cố trong hình ảnh ba chiều giờ đây cũng có thể thực hiện được.
Cuộc
đối thoại bị thay đổi kỹ thuật số “có nguy cơ phương hại thỏa thuận của
những người liên quan ban đầu,” Scott Stroud, giám đốc chương trình đạo
đức truyền thông của Đại học Texas tại Austin, nói. “Những gì các diễn
viên nghĩ rằng họ đang đồng ý thực sự lại không phải là những gì được
tạo ra.”
Denver D’Rozario, giáo sư marketing của Đại học Howard,
người đã nghiên cứu về phần mềm hồi sinh diễn viên đã chết, cho biết
công nghệ này sau khi ra mắt có thể mở ra cơ hội thay đổi việc làm phim
mãi mãi.
Carrie Fisher trong Star Wars: The Last Jedi
|
“Giả sử… trong phim, một anh chàng uống lon Pepsi, và 20 năm nữa bạn
nhận được tài trợ từ Coke,” D’Rozario nói. “Bạn có đổi lon Pepsi thành
Coke không?” “Thời điểm nào mọi thứ có thể được thay đổi? Thời điểm nào
thì có thể tin được?”
Mann cho biết công nghệ của anh có rất
nhiều ưu điểm, từ việc phá bỏ rào cản ngôn ngữ và khơi dậy sự đồng cảm
xuyên biên giới cho đến giúp các diễn viên không phải đau đầu vì chuyện
quay lại cảnh phim. Theo quan điểm của anh, các tình huống như tài trợ
Coke trong giả định của D’Rozario chính là những dòng doanh thu mới.
Mann cho biết thêm, Flawless chủ động xây dựng một sản phẩm hỗ trợ thay vì thay thế diễn xuất đích thực của con người.
“Có
một cách để sử dụng công nghệ tương tự ngành công nghiệp [hiệu ứng hình
ảnh] đã thiết lập, đó là: làm điều đó một cách an toàn, làm đúng, làm
hợp pháp, với sự đồng ý của mọi người liên quan,” anh nói.
Công nghệ làm phim AI có thể giúp ích hoặc gây hại cho các diễn viên, tùy theo cách nó được sử dụng
|
Và công ty đã tham gia “tất cả các hiệp hội lớn” về cách tạo và sử dụng công nghệ này một cách hợp lý, vị đạo diễn nói tiếp.
Đại
diện SAG-AFTRA nhấn mạnh rằng công nghệ làm phim AI có thể giúp ích
hoặc gây hại cho các diễn viên, tùy theo cách nó được sử dụng.
“Khi
không làm được gì nhiều ngoài việc cải thiện mặt kỹ thuật số cho diễn
xuất của các thành viên trong hiệp hội, công nghệ chỉ đòi hỏi khả năng
đưa ra sự đồng ý sau khi được giải thích và có thể là chi phí bổ sung,”
Jeffrey Bennett, cố vấn chung của SAG-AFTRA, cho biết trong một email.
“Ở thái cực kia là những công nghệ có thể thay thế màn trình diễn truyền
thống hoặc lấy màn trình diễn của các thành viên hiệp hội và tạo ra
những màn trình diễn hoàn toàn mới; đối với những điều này, chúng tôi
khẳng định rằng diễn viên là đối tượng thương lượng bắt buộc.”
Tốt xấu gì thì con tàu cũng đã rời ga.
Các chuyên gia cho rằng công nghệ AI sẵn sàng biến đổi gần như mọi
khía cạnh của Hollywood, từ động lực làm việc và mô hình tài chính đến
cách khán giả nghĩ cái gì là thật cái gì giả
|
Fall hiện đang phát trực tuyến và Mann cho biết những phim khác
mà công ty anh tạo ra ra mắt vào Giáng sinh 2022 — mặc dù anh không thể
công khai tên chúng.
Nếu bạn xem một bộ phim mùa Noel vừa rồi, không chừng là AI đã giúp tạo ra nó.
Liệu bạn có nhận ra? Và liệu có quan trọng không?
Dịch: © Ngô Bình @Quaivatdienanh.com
Nguồn: Los Angeles Times