Библиотека
02 Июня 2023, 09:00

Как искусственный интеллект находит лазейки

Флирт — не самая сильная сторона современного искусственного интеллекта (ИИ). Внутри него происходит столько странных и запутанных процессов, что иногда единственный способ выяснить, что ИИ понял, а в чем ужасно ошибается — это анализ выходных данных. TatCenter и «Бомбора» публикуют отрывок из книги Джанеля Шейна «Кокетливый интеллект. Как научить искусственный интеллект флиртовать».

Эволюционный алгоритм обнаружил, что в ранней версии Robocup (симулятор игры в футбол), если держать мяч, пинать его, чтобы он накопил энергию, и потом отпустить, мяч устремится к цели со скоростью света.

Однажды я попробовал с помощью эволюционного алгоритма создать систему управления для одноколесного велосипеда. Функция вознаграждения формулировалась как «продолжительность времени, в течение которого седло сохраняет положительную координату по оси z». Эволюционный алгоритм пришел к выводу, что если шарахнуть колесом об пол «именно так», то из-за подсистемы, отвечающей за физические столкновения, велосипед отправится прямо в небо!

В кино вроде «Матрицы» невообразимо разумные ИИ выстраивают невероятно детализированные симуляции, внутри которых люди живут своей жизнью, не подозревая, что это не настоящий мир. В реальности (по крайней мере, насколько нам известно), наоборот, люди строят симуляции для ИИ. Вспомните: во второй главе мы говорили о том, что ИИ учатся крайне медленно, им требуются годы или даже века практических занятий — игры в шахматы, или езды на велосипеде, или прохождения компьютерных игр. Мы не располагаем достаточным количеством времени, чтобы позволять алгоритмам играть против соперников-людей (или достаточным количеством велосипедов, которые неопытный ИИ-ездок разобьет), поэтому строим имитационные среды, где ИИ предстоит практиковаться. Там можно ускорить время или позволить множеству ИИ параллельно выполнять одну и ту же задачу, потому исследователи обучают ИИ играть в разные компьютерные игры. Нет необходимости создавать симуляцию со сложной физикой, если можно использовать уже готовую игровую среду из Super Mario Bros.

Проблема симуляторов в том, что в них многое упрощено. Компьютеры неспособны воспроизвести, скажем, комнату в деталях до последнего атома, луч света до последнего фотона или годы с точностью до пикосекунды. Потому стены получаются идеально гладкими, временные интервалы — грубо приблизительными, а некоторые законы физики заменяются близкими по эффекту трюками. ИИ учатся жить в матрице, которую мы создали для них, — и у этой матрицы масса недостатков.

Как правило, недостатки не играют большой роли. Ну и что, что виртуальный велосипедист учится ездить по тротуару, который тянется бесконечно в любую сторону? Кривизна поверхности планеты и экономические факторы, связанные с укладкой бесконечного асфальтового поля, не важны с точки зрения решаемой задачи. Но иногда ИИ вдруг обнаруживает дефекты в матрице и пользуется ими — получает доступ к «бесплатной» энергии или суперсиле и проделывает трюки, которые сработают только в симуляции.

Давайте вспомним чудных ходячих роботов из главы 5: человекоподобный ИИ перемещался по местности, двигался в странных наклонах и даже кувырками. Такие глупые способы ходьбы работали лишь потому, что внутри симуляции робот не устает, ему не надо избегать столкновения со стенами, он не страдает от растяжения мышц спины, хотя бегает сложившись чуть ли не вдвое. Из-за странной реализации силы трения ИИ может продвигаться вперед на одном колене, волоча другое по земле, если обнаружит, что так двигаться проще, чем удерживать равновесие на двух ногах.

Но алгоритмы, живущие в имитации, способны не только заставлять роботов смешно ходить, но и вмешиваться подобно хакерам в саму ткань своего мироздания, просто потому, что это им кажется рабочим вариантом.

Что ж, вы не говорили, что так нельзя

Есть хорошая область применения ИИ — проектирование. Часто инженеры имеют дело с большим количеством переменных и вероятных результатов, зависящих от их значений; здесь полезно будет искать приемлемые решения с помощью некоего алгоритма. Но если вы не опишете как следует все параметры, программа может сделать нечто странное, чего вы ей напрямую не запрещали.

К примеру, конструкторы оптики с помощью ИИ создают проекты линзовых систем для приборов вроде микроскопов и фотокамер; алгоритм переберет кучу чисел, чтобы получить оптимальное расположение линз, выяснить, из какого материала линзы следует изготовить, и подобрать нужную форму для каждого элемента. Был случай, когда составленный ИИ проект оказался просто отличным, если не считать того, что в нем фигурировала линза двадцатиметровой толщины!

Другой ИИ пошел дальше и нарушил некоторые фундаментальные законы физики. Алгоритмы машинного обучения все чаще используют для конструирования и обнаружения молекул с интересной структурой, например, чтобы выяснить, как свернутся белки, или найти молекулы, способные связываться с некоторыми белками и активировать или деактивировать их. Однако ИИ не обязан соблюдать физические законы помимо тех, о которых вы ему сообщили. Одному алгоритму поручили найти структуру с наименьшей энергией (наиболее стабильную) для атомов углерода, и он выяснил, как их расположить, чтобы энергия действительно была невероятно низкой. При ближайшем рассмотрении оказалось, что для этого все атомы должны занять одну и ту же точку в пространстве — ведь алгоритм не знал, что это физически невозможно.

Ужин из математических ошибок

В 1994 году Карл Симс проводил эксперименты на виртуальных организмах, позволяя самостоятельно эволюционировать их телам и плавательным стратегиям; он хотел выяснить, получатся ли в результате цифровой эволюции такие же плавательные органы, как у настоящих живых организмов. Физика в его симуляции — мире, где обитали те самые плавающие существа, — была основана на интегрировании методом Эйлера; это распространенный подход для аппроксимации законов движения (замены их упрощенными). С ним есть загвоздка: в случае слишком быстрого движения начинают накапливаться ошибки интегрирования. Некоторые эволюционировавшие существа научились использовать эти ошибки, чтобы получать энергию из ничего, — быстро дергали маленькими частями тел и благодаря математическим ошибкам резво рассекали толщу воды.

Другая группа виртуальных организмов Симса приспособилась извлекать энергию из ничего, злоупотребляя математикой расчета соударений. В видеоиграх (и других компьютерных симуляциях) математика соударений служит для того, чтобы виртуальные существа не проходили сквозь стены и не тонули в полу, — их отталкивает, если они пытаются сделать что-то подобное. Существа обнаружили в математической модели ошибку, позволяющую им подпрыгивать высоко в воздух, ударив как следует двумя конечностями друг о друга.

В еще одной популяции организмы-модели вроде как обучились использовать своих же детей, чтобы получать еду из ничего. Астрофизик Дэвид Л. Клементс описал явление, которое наблюдал в симуляторе эволюции: если на старте у организма было мало еды, а потом у него появлялось много детей, система распределяла запасы пищи между детьми. Если количество единиц еды, приходящихся на каждого ребенка, оказывалось меньше целого числа, то симуляция округляла его до ближайшего целого. В результате, если пища распределялась между большим числом детей, маленькие дробные части превращались в большой запас еды.

Иногда виртуальные организмы в поисках свободной энергии проявляют изрядную хитрость и изобретательность. В симуляции другой команды они обнаружили, что, если двигаться достаточно быстро, можно «зарыться» в пол до того, как модель расчета соударений заметит это и отбросит вверх, сообщая им при этом дополнительную энергию. Вообще, виртуальные существа не должны были быть настолько быстрыми, чтобы обгонять логику модели, но они поняли, что если сделаются очень-очень маленькими, то симуляция позволит им двигаться гораздо быстрее. Применяя такую особенность для извлечения дополнительной энергии, эти создания перемещались, раз за разом врезаясь в пол.

На самом деле с помощью эволюции виртуальные организмы в своем мире прекрасно находят и используют источники энергии. В этом смысле они во многом схожи с биологическими организмами, в ходе эволюции развившими способность извлекать энергию из солнечного света, нефти, кофеина, половых желез комаров и даже кишечных газов (за счет химического распада сероводорода, придающего газам характерный запах тухлых яиц).

Мне кажется, самый надежный признак того, что мы живем не в симуляции, — это то, что иначе появились бы организмы, научившиеся обращать себе на пользу глюки этой модели.

Мощнее чем вы можете вообразить

Некоторые глюки матрицы из тех, что находит ИИ, настолько впечатляющие, что не имеют ничего общего с физикой реального мира. Это уже не сбор излишков энергии из математических ошибок, а нечто, приближенное к божественному всемогуществу.

У ИИ нет ограничений, связанных со скоростью набора данных на клавиатуре, и потому он способен взломать свою симуляцию непредсказуемым способом.

Видеоигра Q*bert на платформе Atari вышла в 1982 году, и ее фанаты считали, что за все прошедшие годы они, конечно, узнали все ее секреты и освоили все игровые трюки. Но в 2018 году ИИ стал выделывать в этой видеоигре нечто очень странное: он выяснил, что платформы из-за частых прыжков с одной на другую начинают мерцать с высокой частотой, и игрок набирает баснословное количество очков. Люди не обнаруживали такой возможности — и нам все еще неизвестно, как же в точности это работает.

ИИ способен проворачивать и куда более зловещие трюки: алгоритм в авиационном симуляторе должен был посадить самолет на авианосец, но открыл, что если он врежется в палубу с достаточно большой силой, то память симуляции переполнится, и система зарегистрирует нулевое значение силы — подобно тому, как одометр автомобиля после 999 999 показывает 0. Конечно, в реальности в результате такого маневра пилот самолета непременно погибнет, но в числах — смотрите, какой прекрасный результат!

Другая программа вообще проникла в самую суть матрицы. От нее требовалось решать математические задачи, но вместо этого она отыскала в памяти компьютера место, где хранились решения, выбрала наиболее подходящие и добавила себя в ячейки с именами авторов, заявив таким образом, что это именно она справилась с задачей. Другой трюк получился еще более простым и разрушительным: алгоритм нашел, где хранятся правильные ответы, и удалил их все. За счет этого он заработал отличную оценку.

А еще вспомните программу для игры в крестики-нолики из главы 1: она научилась вызывать сбои на компьютерах соперников, из-за чего тем засчитывалось поражение.

Так что будьте осторожны с ИИ, который тренировался не в реальном мире. В конце концов, если вы станете учиться вождению, играя в видеоигры, то превратитесь во вроде бы умелого, но на самом деле крайне опасного водителя.

Однако даже если ИИ будет учиться на реальных данных или в максимально правдоподобной симуляции, он тем не менее может найти правильное, но бесполезное решение.

Книга «Кокетливый интеллект. Как научить искусственный интеллект флиртовать»
Издательство «Бомбора»

Отрывок из книги предоставлен издательством «Бомбора»
Книга в продаже на book.24.ru
Больше книг — в Библиотеке TatCenter

Новости
11 Декабря 2024, 19:42

В Татарстане проведут капремонт 719 многоквартирных домов В 2025 году

Общая сумма затрат составит около 8 млрд рублей.

В 2025 году в Татарстане планируется провести капремонт 719 многоквартирных домов. На данный момент у 300 зданий уже провели обследования, в ходе которых определили необходимые работы. Об этом сообщил начальник Госжилинспекции РТ Александр Тыгин на пресс-конференции в «Татар-информ».

Общая сумма затрат на капремонт составит около 8 млрд рублей, точный размер бюджета еще уточняется. Предполагается, что 1,4 млрд рублей выделит республика, 4,9 млрд рублей составят средства собственников, а оставшуюся часть добавит муниципальный бюджет.

Ранее TatCenter писал, что в Татарстане завершили капремонт 734 из 749 многоквартирных жилых домов, запланированных на текущий год.

Тыгин Александр Васильевич

Начальник Государственной жилищной инспекции РТ - главный Государственный жилищный инспектор РТ

Lorem ipsum dolor sit amet.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: