Инженеры из Массачусетского технологического института с коллегами обнаружили, что искусственный интеллект очень редко (примерно в 5% случаев) сталкивается с визуальной ошибкой парейдолии — то есть видит лица там, где их нет. Однако если компьютерные модели обучать на изображениях животных, то иллюзия начинает возникать в три раза чаще. Исследователи таким образом пытаются выяснить, почему наш мозг совершает эту ошибку и выдает нам «смайлики на Марсе», удивленную яичницу или грустную розетку. Выводы
Что такое парейдолия
Парейдолия — это оптическая иллюзия, при которой человек видит осмысленные для него образы там, где их нет. Одна из самых распространенных — парейдолия лица, и присуща она вполне здоровым людям.
Авторы нового исследования решили выяснить, сталкиваются ли модели ИИ, нацеленные на распознавание человеческих лиц, с такой ошибкой. И если да, то как она возникает в системе — возможно, это могло бы проиллюстрировать возникновение парейдолии у человека.
Как проводили исследование
Команда отобрала около 5000 изображений с «иллюзорными» лицами для экспериментов. И протестировала модель машинного обучения RetinaFace, которую используют для обнаружения лиц. Разные версии в среднем в 5,4% случаев попадались в ловушку парейдолии.
После первоначального испытания в модель загрузили более 32 тысяч изображений человеческих лиц для обучения и снова протестировали — теперь ИИ в 6,7% случаев видел лица в неодушевленных предметах. Тогда модель обучили уже на 22 тысячах изображений с мордами животных — это увеличило распознавание ненастоящих лиц у ИИ до 16%, почти втрое больше, чем в первых результатах.
Перед заключительным тестом модели предоставили объединенный набор данных из лиц людей, животных и парейдолических «лиц», после чего показатель снова увеличился — уже до 34% ошибочного распознавания. Результаты продемонстрировали, что и компьютер можно научить феномену парейдолии.
Зачем нужна парейдолия
Авторы предполагают, что причина в эволюции у ранних людей. Когда первобытному человеку нужно было быстро обнаруживать хищников в лесу или находить добычу на охоте, наш мозг адаптировался и включил животных в свой быстродействующий шаблон лица. И когда ИИ обучили таким же образом, он отразил эту версию инстинкта человека.
Предыдущие работы также объясняли парейдолию необходимостью быстро распознавать лица в окружающей среде, что помогало древнему предку оставаться в безопасности. Сложная зрительная система мозга просеивает огромное количество информации, выбирая важные для выживания фрагменты. Быстрый способ распознать лицо для мозга — сравнение с базовым шаблоном, который представляет собой овал с двумя глазами, носом, ртом.
Некоторые ученые связывали парейдолию с творческими способностями. Однако оптическая ошибка была обнаружена и у макак-резусов. А значит, движущими силами парейдолии скорее можно назвать социальное взаимодействие и безопасность.
У исследования есть и критики, которые считают, что разные алгоритмы ИИ будут по-разному демонстрировать парейдолию. Поэтому на такие работы не стоит опираться при изучении феномена.
Почему парейдолии особенно подвержены женщины после родов, мы объясняли здесь.