Ловушка «гиперусредненности»: почему ИИ-лица кажутся нам реальнее настоящих

Завороженные иллюзией: как сгенерированные лица вводят зрение человека в заблуждение. Источник: AI

Современные нейросети научились создавать лица, все чаще обманывающие зрение человека. Во многих случаях мы не просто воспринимаем сгенерированные изображения как настоящие — мы считаем их более «правдоподобными», чем реальные фотографии. Новое исследование свидетельствует: причина этого эффекта в том, что искусственный интеллект формирует не индивидуальные черты, а статистически совершенный средний образ.

Эксперимент над восприятием

Авторы работы, обнародованной в British Journal of Psychology, изучили, как люди распознают сгенерированные портреты и почему большинство наблюдателей фактически проваливают эту задачу. В центре внимания оказалась группа «суперраспознавателей» (super-recognizers) — людей с исключительными способностями к запоминанию и различению лиц. В исследовании приняли участие 36 таких экспертов и 89 подготовленных добровольцев.

Изображение сгенерировано нейросетью Grok. Фото: Grok

Испытуемым показывали 200 изображений: половина была создана нейросетью, другая половина – реальные снимки. Результаты оказались отрезвляющими. Обычные участники практически не могли отличить подделки от оригиналов, демонстрируя точность на уровне случайного угадывания. Суперраспознаватели справились лучше, но даже их результат остановился на отметке 57%. Это означает, что задача остается сверхсложной даже для тех, чей мозг заточен под идентификацию лиц.

Магия «среднего» лица

Исследователи обнаружили важную закономерность: чем лучше человек распознает подлинные лица, тем выше его способность проявлять искусственные. Это доказывает, что мы ищем не технические дефекты (вроде лишних зубов или кривых сережек), а опираемся на фундаментальные механизмы восприятия. Чтобы понять причину ошибок, ученые проанализировали изображение с помощью алгоритмов, строящих карту пространства лиц.

Примеры лиц по эксперименту. Фото: British Journal of Psychology

Выяснилось, что реальные люди распределены в этом пространстве широко и неравномерно. У нас есть множество уникальных, «неправильных» деталей. Сгенерированные портреты концентрируются ближе к центру — в зоне математически усредненного лица. Этот эффект назвали «гиперусредненностью». Алгоритмы специально угнетают редкие черты, усиливая наиболее распространенные. В результате получается не конкретный человек, а некий эталонный портрет без всяких отклонений.

Почему мы ведемся на подлог

Парадокс в том, что отсутствие дефектов делает ИИ-лицо убедительными. В реальности большинство из нас имеет специфические сочетания признаков, которые с точки зрения статистики выглядят «нелогично». Нейросеть же рисует образы, которые кажутся более гармоничными и «правильными», чем живые люди. Эксперты-распознаватели интуитивно чувствуют эту подвох, ориентируясь именно на чрезмерную типичность лица, в то время как обычные люди обращают внимание на привлекательность или эмоциональность.

Авторы подчеркивают: использование таких изображений в судебных процедурах или психологических тестах может искажать восприятие. ШИ-портреты не нейтральны — они систематически смещены в сторону вымышленной нормы. Способность замечать эти тонкие отклонения от реального человеческого несовершенства становится критическим навыком в эпоху дипфейков.

Пока нейросети учат нас сомневаться в своих глазах, другие технологии находят языковым моделям неожиданное применение вне генерации картинок – например, Boeing научил спутники «болтать» для оптимизации космической связи.