«GT Sophy» отточил тактику и технику, чтобы победить 95 % игроков-людей в игре Playstation за два дня
Изображение с финала Мировой серии Gran Turismo 2021. Фото: Клайв Роуз — Gran Turismo/Gran Turismo/Getty Images. @iansampleWed 9 февраля 2022 г., 16:01 по Гринвичу
Впервые опубликовано в среду, 9 февраля 2022 г., 16:00 по Гринвичу
Разгромив смертных чемпионов в покере, шахматах, го и Starcraft, программа искусственного интеллекта доставила еще одно унижение, оставив лучших в мире гонщиков видеоигр в пыль.
< p class="dcr-1wj398p">Исследователи из Sony обучили ИИ по имени GT Sophy играть в игру Gran Turismo для PlayStation и обнаружили, что через два дня он может обогнать 95% игроков-людей и продолжает сокращать круг на десятые доли секунды. раз в течение следующей недели.
Помимо изучения самых быстрых маршрутов на разных гоночных трассах, GT Sophy оттачивала свою тактику ускорения и торможения, когда нужно подвернуться позади быстрой машины впереди, и когда вырваться из слипстрима и попытаться обогнать. Столкнувшись с автомобилями, которые преградили ему путь, GT Sophy переключился на другую гоночную трассу, чтобы обойти тех, кто впереди.
Чтобы усложнить задачу, GT Sophy пришлось учитывать штрафы за гонки, которые налагались за нарушения, основанные на двусмысленных правилах, что повторяет тонкие человеческие суждения, которые могут иметь значение между победой и поражением в Формуле-1.
«Успех GT Sophy в этой среде впервые показывает, что можно обучать агентов ИИ, которые лучше, чем лучшие гонщики-люди, на различных типах автомобилей и трасс», — пишут авторы. написать в журнале Nature.
Команда под руководством Питера Вурмана, директора Sony AI America, создала GT Sophy на основе распространенной техники искусственного интеллекта, называемой обучением с подкреплением. ИИ получал информацию из нескольких игр Gran Turismo, и, увеличивая вознаграждение за быстрое время прохождения круга и сводя к минимуму штрафы за столкновения и т. п., программа неуклонно осваивала игру.
Как и в случае с другими ИИ, победившими чемпионов среди людей, GT Sophy — это нечто большее, чем просто игры. Превосходство в Gran Turismo демонстрирует, как ИИ может научиться стратегиям работы в сложной ситуации, когда капризы человеческого суждения имеют решающее значение. Например, может показаться разумным подъехать как можно ближе к впереди идущему автомобилю, но если ведущий водитель нажмет на тормоз слишком рано, неизбежный съезд сзади предполагает, что над стратегией нужно поработать.
Что еще более важно, прорыв повлечет за собой дебаты о лучших вычислительных подходах для использования в беспилотных автомобилях. Нейронные сети, лежащие в основе GT Sophy и других ИИ, таких как DeepMind, хорошо зарекомендовали себя при идентификации объектов в мире, но другие основные задачи, такие как планирование наилучшего пути, часто основаны на чистой физике. GT Sophy предполагает, что нейронные сети тоже могут хорошо с этим справиться.
Несмотря на впечатляющий дебют ИИ, команда Sony признает, что GT Sophy еще многому предстоит научиться. На длинной прямой ИИ обгоняет при первой же возможности, иногда оставляя сопернику достаточно дороги, чтобы использовать слипстрим GT Sophy и отдать пас. Авторы отметили, что без штрафов за столкновение GT Sophy стал «заметно более агрессивным».
В сопроводительной статье в Nature профессор Кристиан Гердес, содиректор Центра автомобильных исследований из Стэнфордского университета, который не участвовал в исследовании, пишет: «Что действительно выделяется, так это производительность GT Sophy против водителей-людей в соревновании один на один. GT Sophy не использует преимущество во времени круга, чтобы переиграть соперников, а просто обгоняет их».
Свежие комментарии