'группа' сформирована компанией Metaphysic с участием Саймона Коуэлла и Элвиса Пресли, а также Хайди Клум и Софии Вергара на бэк-вокале. Фото: NIPI
В финале телешоу America's Got Talent на прошлой неделе были ливанская танцевальная труппа, танцор на пилоне и певица. от Хути & Blowfish и… два технических предпринимателя, которые, согласно их биографиям в социальных сетях, «разрабатывают инструменты и программное обеспечение искусственного интеллекта для создания гиперреалистичных синтетических медиа в больших масштабах».
Том Грэм и Крис Уме — новые крестные отцы так называемой технологии дипфейков, умопомрачительной иллюзии, с помощью которой человек в видео изменяется в цифровом виде, так что он кажется кем-то другим. Таким образом, в финале America's Got Talent четыре малоизвестных певца выстроились на сцене и, благодаря футуристической хитрости искусственного интеллекта, встроенной в камеры перед ними, стали дипфейковыми версиями Элвиса Пресли и судей Саймона Коуэлла, Хайди Клум и Софии Вергары на большом экране. экран позади них.
Все это происходило в реальном времени, как будто необычайно реалистичный квартет пел Devil in Disguise вживую на сцене. Коуэлл, Клум и Вергара (настоящие версии) смотрели с разинутыми ртами со своих судейских мест в партере. А вы думали, что телевизионные шоу талантов посвящены танцам собак. Подумайте еще раз: реалити-шоу стало телевидением виртуальной реальности.
«Что за ерунда, что я могу выиграть AGT, верно?» — говорит Грэм, 38-летний юрист, получивший образование в Гарварде, вспоминая свое невероятное столкновение со славой в прайм-тайм (Грэм и Уме не выступали сами по себе, но они появились на сцене как мозги, стоявшие за операцией). «На самом деле это было очень весело, потому что мы не занимаемся выступлением, и поэтому такого давления не было. За кулисами мы меньше нервничали и как бы меньше на этом катались. Вся съемочная группа и другие исполнители очень милые».
Metaphysic, компания, основанная Грэмом вместе с Крисом и его братом Кевином Уме, в итоге заняла четвертое место в финале (победителем стала ливанская танцевальная группа Mayyas). Но они произвели большой фурор. Их первое прослушивание состоялось еще в июне, и на нем они убедили финалиста 2018 года Дэниела Эммета спеть чикагскую софт-рок-балладу You’re the Inspiration в роли дипфейкового Коуэлла. Между тем настоящий Коуэлл смотрел сквозь пальцы.
Неизвестный как человек без эго, настоящий Коуэлл впоследствии спросил, было ли «неуместно влюбляться в участницу». Грэм настаивает на том, что Коуэлл не знал, что его собираются обмануть до того первого прослушивания: «Он выглядел искренне удивленным». И что Коуэлл сказал ему потом за кулисами? «Он был поражен этим. Ему очень понравилась его оригинальность. А потом мы поговорили о крикете», — говорит Грэм, австралиец.
Прежде чем интервью провалится в кроличью нору дипфейка, я прошу Грэма объяснить, как все это работает. Это все довольно безумно, но вот наука. Metaphysic разрабатывает программное обеспечение, которое автоматизирует процесс воссоздания внешности человека. Он «обучает» — по словам Грэма — свое программное обеспечение, показывая ему сотни тысяч изображений целевого человека, такого как Элвис. Затем очень сложные алгоритмы программного обеспечения (известные как глубокие нейронные сети) учатся имитировать и точно предвидеть движения человека.
Хотя мы привыкли видеть в фильмах компьютерные образы (CGI) и визуальные эффекты (VFX), они предполагают своего рода ручной человеческий ввод, поскольку эффекты закрашиваются или подкрашиваются. Здесь нет такого человеческого вмешательства. Алгоритм «Метафизики» «строит собственное понимание [через] неконтролируемое изучение того, как выглядит лицо Элвиса в различных обстоятельствах», — объясняет Грэм. «Это создает своего рода туманное детское понимание того, как лицо Элвиса будет выглядеть в любой конкретный момент».
Технология настолько сложна, что дипфейк Элвис на экране может имитировать все, что делает актер перед камерой в режиме реального времени, как это видели миллионы людей в шоу America's Got Talent. Это связано с тем, что камера обновляет движения дипфейка до 30 раз в секунду.
Дипфейк Элвиса Пресли в действии Фото: NIPI
Вот как это работает. Но почему это работает? Конечно, мы, зрители, знаем, что то, что мы смотрим, — фальшивка? Это не так, говорит Грэм. Это потому, что мы перепрыгнули через «зловещую долину» — выражение, придуманное во время бума японской робототехники в семидесятых. Теория зловещей долины утверждает, что роботы, куклы или компьютерные изображения, которые выглядят вполне человеческими, нас пугают, потому что они недостаточно человечны. Но технологии в наши дни настолько хороши, что зрители вышли за пределы сомнительной стадии. «Как только лица становятся неотличимы от настоящих людей, вы выпрыгиваете из сверхъестественной долины и чувствуете себя с ними очень комфортно», — говорит Грэм.
Он говорит, что возможности в мире развлечений безграничны. Когда дело доходит до музыки, Грэм видит время, когда известные исполнители будут выступать на сцене в дуэте со своими молодыми личностями. Некоторые члены команды Metaphysic были частью Industrial Light & Волшебная команда, которая работала над шоу ABBA Voyage Abba-tar. Хотя эта технология немного отличается (в шоу ABBA использовались 3D-модели тел, а в Metaphysic — алгоритмы искусственного интеллекта), потенциал виртуальных концертов такой же. «Элвис мог бы дать концерт в Лас-Вегасе. Вы можете структурировать его таким образом, чтобы была молодая версия Элвиса, старая версия и средняя версия», — говорит Грэм.
На самом деле актерам не нужно быть на сцене, как это было в America’s Got Talent. Шоу может быть предварительно записанным шоу только для экрана. На самом деле, «только экраны, вероятно, привлекательны для людей, производящих эти вещи, потому что фактическое ежедневное производство менее интенсивно, если вы проводите его 300 дней в году в Вегасе». Также возможен вариант Mix and Match: живая аккомпанирующая группа с предварительно записанными гиперреальными вокалистами на экране.
Дипфейки войдут и в мир кино. Можем ли мы перейти к сути, спрашиваю я Грэхема, когда звезда фильма на самом деле вообще не в фильме? Когда вместо них появляется версия дипфейка? «Абсолютно», — говорит он. Однако он добавляет, что актеры, как правило, любят свое дело, поэтому более вероятно, что они будут использовать технологию дипфейка в качестве дополнения к своему выступлению. «Можно представить, что актеры могут играть более молодые версии самих себя в фильме, — говорит Грэм.
Технология позволит отказаться от протезирования и макияжа, используемых в процессе омоложения на экране, и ее можно будет применять ко всему телу: 35-летний человек двигается иначе, чем 70-летний, разница, которую не исправят искусственный нос и искусный макияж. Гангстерская эпопея Мартина Скорсезе «Ирландец» воссоздала постаревшие лица таких людей, как Роберт Де Ниро, используя технологии, но не всегда движения тела персонажей. Это изменится. Но до создания спектакля, удостоенного премии Оскар, с использованием дипфейков еще далеко, – говорит Грэм.
Аль Пачино и Роберт Де Ниро, омолаживающие для фильма Мартина Скорсезе «Ирландец». Фото: Alamy
Некоторые большие объявления неизбежны. «Метафизика» работает над «всем тем, о чем мы только что говорили», с участием «абсолютно самых известных людей на Земле», — говорит Грэм. Но он по-прежнему молчит о подробностях. Ожидайте новостей достаточно скоро. Эта технология была разработана всего около 18 месяцев назад, поэтому проекты все еще находятся в стадии производства. (Стоит сказать, что эта так называемая многослойная технология метавселенной тоже призвана вывести жизнь из сферы развлечений: она позволит проводить виртуальные семейные и рабочие встречи, предсказывает Грэм.)
Говоря о самых известных людях на Земле, пожалуй, самый известный в мире актер запустил всю эту дипфейковую затею. Уме стояла за дипфейком Тома Круза, который в прошлом году стал феноменом TikTok. Серия видеороликов аккаунта под названием DeepTomCruise показала, как мегазвезда делает серию глупых вещей, от угроз бороться с аллигатором до танцев под Freedom Джорджа Майкла в нижнем белье и подготовки к премьере фильма с Пэрис Хилтон.
Аккаунт, чей субъект выглядит, говорит и ведет себя точно так же, как Том Круз, собрал более 250 миллионов просмотров и 3,6 миллиона подписчиков. Только, конечно, это не он. Грэм объясняет, что DeepTomCruise на самом деле немного предшествовал Metaphysic. Это был арт-проект между Крисом Уме и актером по имени Майлз Фишер, который «играет» Круза. Грэм увидел их первое видео («Меня обманули на пару секунд») и «сразу же позвонил Крису, и через месяц мы запустили Metaphysic».
Разве Круз не возражал против дипфейка? Он известен своей скрытностью и заботой о своем имидже. Очевидно нет. «Мы сразу же пошли и связались с командой Тома Круза по всем возможным каналам, и в конце концов они вернулись и сказали, что у них нет никакого мнения в любом случае», — говорит Грэм. «Мы предложили дать им [возможность] остановиться, переписать права, все, что они действительно хотят, потому что мы были ошеломлены полученным ответом. И я считаю, что их ответ был справедливым признаком того, что они с этим согласны». Остается открытым канал связи между Metaphysic и командой Cruise, поэтому последняя может попросить их прекратить, если они того пожелают.
<р>Это намекает на гораздо более широкую дискуссию в мире дипфейков — об этике. Если теперь возможно создать фальшивую, но реалистичную версию кого-либо еще с помощью технологий, не влекут ли за собой огромные последствия для мошенничества, кражи личных данных и интеллектуальной собственности и всех видов эксплуатации, от финансовой до сексуальной? Грэм говорит, что технология сопряжена с ответственностью и что «Метафизика» уделяет «большое внимание» этике и, в частности, согласию. Правило, по его словам, должно заключаться в том, что люди владеют и контролируют свое собственное гиперреальное подобие, то есть они также владеют и контролируют данные, используемые для обучения и создания этого подобия.
Другими словами, люди должны иметь полный контроль над своей цифровой ДНК. Metaphysic запустила платформу под названием Every Anywhere, которая позволяет людям владеть своими данными, когда они взаимодействуют со сторонними компаниями, работающими в метавселенной. «В конечном итоге я считаю, что биометрические данные, которые представляют нас как личности, будут регулироваться [правительствами]», — говорит Грэм. Что, во избежание сомнений, было бы неплохо.
Технология продолжает развиваться со скоростью. Грэм говорит, что качество дипфейка Коуэлла значительно улучшилось между первым прослушиванием AGT в июне и финалом на прошлой неделе. Это связано с тем, что алгоритм совершенствуется по мере обучения. Он продолжает учиться: чем больше настоящего Коуэлла показывают, тем лучше становится версия дипфейка.
Так чем это закончится? Могу ли я, например, выбрать концерт «Роллинг Стоунз» любой эпохи и посмотреть его виртуально в качестве зрителя (при условии, что «Стоунз» согласятся на проект)? «Да, абсолютно. Мы могли бы, например, поработать с Rolling Stones и создать три концерта из разных эпох. Следующим шагом будет то, что вы сможете потреблять его через гарнитуру виртуальной реальности».
Потенциал погружения этой технологии звучит поистине ошеломляюще. Но не так умопомрачительно, как то, что говорит Грэм дальше. «Тогда следующим шагом будет то, что мы сможем поставить вас на сцену. Так вы станете бэк-вокалисткой. Или барабанщик. Мы создаем гиперреальное пространство, поэтому, если мы сможем создать гиперреальную версию Кита Ричардса, мы сможем создать и одного из вас».
Вы имеете в виду, что я мог бы выступать на сцене в дуэте с Китом Ричардсом? «Да. Внезапно опыт может стать более персонализированным и глубоким. Вы действительно могли бы быть на сцене с Rolling Stones».
Коуэлл описал Metaphysic как «вероятно, самое невероятное и оригинальное выступление», которое у него было на America’s Got Talent. Оригинал? Возможно, нет, учитывая, что он имитирует реальных людей. Но невероятно? С этим трудно поспорить.
Свежие комментарии