Браузеры с искусственным интеллектом еще недостаточно умны, чтобы захватить Интернет

  • Браузеры с искусственным интеллектом пока не представляют реальной угрозы для Chrome, поскольку они страдают от программных ошибок и с трудом выполняют основные запросы пользователей.
  • Внедрение «агентного просмотра» требует новой структуры Интернета, в которой веб-сайты могут иметь две версии — одну для людей и одну высокоструктурированную для роботов.
  • Отсутствие надежности и юридические споры с издателями являются основными препятствиями, которые заставляют пользователей доверять ИИ только для задач с низкими ставками.

Когда в октябре OpenAI представила браузер на основе искусственного интеллекта, инвесторы Alphabet Inc. выразили обеспокоенность по поводу того, что это будет означать для Google Chrome, повсеместного шлюза в Интернет, используемого миллиардами людей по всему миру.

Тем не менее, текущие версии браузеров с искусственным интеллектом далеки от того, чтобы сделать традиционные продукты, такие как Chrome, устаревшими: новые предложения от таких компаний, как OpenAI и Perplexity AI Inc., содержат программные ошибки и натыкаются на некоторые, казалось бы, простые запросы, как обнаружило агентство Bloomberg News после месяца тестирования.

Новые браузеры, в том числе Атлас OpenAI и Comet от Perplexity выдвигают на первый план помощников искусственного интеллекта, заменяя поисковые системы в качестве опции по умолчанию при вводе запросов пользователями. Многие также предлагают функцию, называемую просмотром агентов, которая позволяет им выполнять многоэтапные задачи от имени пользователей, такие как заполнение заказов на покупки и получение списка дел из непрочитанных электронных писем.

Цель, по словам разработчиков ИИ, состоит в том, чтобы пользователи могли использовать своих чат-ботов не только из своих собственных приложений или веб-сайтов, но также в браузерах и мобильных операционных системах, что потенциально открывает больше возможностей для таргетинга рекламы и потоков доходов. Наиболее продвинутые функции в настоящее время доступны только на платном уровне, поскольку реализация функций AI-агента может оказаться более дорогостоящей.

Кто пользователь?

На данный момент две категории браузеров поощряют разные виды взаимодействия с пользователем. поведениечто заставляет разработчиков приложений, веб-сервисов и издателей переосмысливать, разрабатывают ли они свои инструменты для людей или роботов, сканирующих Интернет, и могут ли обе группы обслуживаться одними и теми же продуктами.

«Мы видим, как люди меняют способ взаимодействия с Интернетом и способы поиска информации в разных категориях», — сказала Лаура Чемберс, генеральный директор корпорации Mozilla, которая разрабатывает Firefox.

Разработчики традиционных технологий, такие как Google, Microsoft Corp. и Mozilla, применили другой подход, сохранив поиск по умолчанию в своих браузерах и добавив функции помощника AI за последний год.

«Люди по-прежнему используют поиск Google для таких вещей, как шоппинг и путешествия, области, которые действительно хочется исследовать, просмотреть множество разных вещей и принять решение о покупке», — добавил Чемберс.

Опрос пользователей Mozilla, проведенный в прошлом году, показал, что 60 процентов участников чувствовали себя комфортно, используя генеративный искусственный интеллект только для решения простых вопросов или вещей, о которых они знали достаточно, чтобы легко проверить качество вывода и найти ошибки. Ранее не публиковавшиеся результаты основаны на опросе 1000 человек в США и 400 пользователей Firefox, проведенном в мае 2024 года.

Чемберс сказал, что генеративный ИИ более полезен при поиске информации, поскольку он может синтезировать информацию и предоставлять множество ссылок, к которым пользователи могут вернуться. То же исследование показало, что экономия времени может побудить пользователей заменить поиск генеративным искусственным интеллектом, но потребность в точности заставляет их комбинировать два метода.

В опросах пользователей разработчики браузеров приветствуют повышение производительности, достигнутое их продуктами с использованием искусственного интеллекта, и отмечают желание пользователей иметь веб-браузеры, которые могут больше.

По словам представителей OpenAI и Chrome, популярное использование этих браузеров с искусственным интеллектом — это обобщение длинных видеороликов YouTube и задание ассистенту вопросов по теме, упомянутой в видео. Пользователи Comet также задают «в 6–18 раз больше вопросов», чем при использовании обычного чат-бота Perplexity, сказал Джесси Дуайер, руководитель отдела коммуникаций компании.

А потребители хотят большего. Адам Фрай, менеджер по продукту, работающий над браузером Atlas компании OpenAI, рассказал, что OpenAI получает множество запросов от опытных пользователей на возможность планировать задачи, чтобы браузер мог регулярно их повторять.

Например, финансовый специалист может использовать такую ​​функцию для ежемесячного создания отчета или информационной панели с помощью онлайн-инструмента. Тед Чок, технический директор Chrome, сказал, что пользователи хотят, чтобы браузер заполнил государственные формы от их имени и подал налоговые декларации.

Некоторые из этих возможностей были технически возможны еще до эпохи больших языковых моделей, хотя эти инструменты не были так легко доступны. Старые браузеры могли автоматически заполнять формы, если вы ранее сохранили свой адрес, данные кредитной карты или другую личную информацию. YouTube и сторонние инструменты могут расшифровывать видео. Программисты могут писать компьютерные сценарии для массового выполнения запланированных задач.

Эволюция использования

Но не было никакой срочной причины для развития настольных браузеров, особенно с учетом того, что мобильные устройства вытеснили настольные компьютеры в качестве основного источника веб-трафика. По данным Likeweb, сегодня более 67% трафика приходится на смартфоны и планшеты, где мобильные операционные системы и магазины приложений служат шлюзом для автономных приложений.

Теперь чат-боты с искусственным интеллектом, которые воспринимают инструкции на естественном языке, позволяют пользователям требовать большего от своих устройств для выполнения задач.

Бен Гаджер, руководитель технического отдела Atlas и ветеран Google, который участвовал в создании Chrome, в прошлом месяце заявил в подкасте компании, что браузеры с искусственным интеллектом помогают «людям меньше думать о деталях инструментов, которые они используют, и больше о том, чтобы просто выразить то, чего они хотят от системы».

Но способ создания веб-сайтов сегодня представляет собой серьезное препятствие. Игроки в области ИИ, такие как Anthropic PBC и OpenAI, разработали новые протоколы, чтобы поставщики цифровых услуг и агенты ИИ говорили на одном языке.

Насколько хорошо ИИ-помощники будут давать ответы и выполнять задачи, будет зависеть от того, как структурированы веб-сайты. Веб-сайты, которые сильно визуализированы или основаны на повествовании, не обязательно полезны, говорит Линда Тонг, генеральный директор Webflow, инструмента веб-разработки и аналитики.

Интернет для роботов

«Агентам нужны очень структурированные, четко определенные индексируемые данные и очень конкретная информация», — сказал Тонг. «Я верю, что наступит мир, в котором вам понадобятся две версии вашего сайта, и мы уже начинаем этот сдвиг. На самом деле вам захочется поделиться большим количеством различной информации о человеческой версии сайта».

«Роботизированная» версия веб-сайтов расширит возможности браузеров действовать в качестве агентов ИИ, что является ключевой особенностью, которая отличает браузеры с ИИ от обычных. По сути, он позволяет браузеру выполнять щелчки мышью, позиционирование курсора и ввод с клавиатуры на основе инструкций пользователя для чат-бота. Идея состоит в том, что чат-бот может легче выполнять задачи, если веб-сайт структурирован так, чтобы его можно было легко понять, а не иметь причудливые кнопки или карточки, которые привлекательны для людей.

Смешанная ситуация

Большая часть Интернета сегодня по-прежнему создана для людей, что приводит к проблемам с некоторыми более продвинутыми функциями браузеров с искусственным интеллектом. Некоторые из этих симптомов также являются результатом того, что Фрай из OpenAI описывает как браузер Atlas «слишком умный для своего блага» — то есть он слишком много думает о некоторых более простых задачах, таких как нажатие и редактирование документов.

Когда репортер Bloomberg попросил браузер Atlas проанализировать реакции на публикацию в LinkedIn и составить список людей, работающих в определенной отрасли, ему потребовалась минута или две, чтобы решить, как это сделать. После этой долгой паузы он решил сделать снимок экрана каждого раздела во время просмотра, выполняя распознавание изображений, чтобы можно было интерпретировать текст на экране.

В другом случае он застрял в цикле и не смог выполнить инструкции. Между тем, браузер Perplexity почти всегда по умолчанию делает снимки экрана, когда сталкивается с более сложными визуальными компонентами, такими как всплывающие окна.

В тестах Bloomberg на ноутбуке с Windows компьютер нагревался, а вентилятор работал громче, когда использовались некоторые из этих расширенных функций агента. Хотя проблема использования браузерами ресурсов компьютера не нова, разработчики традиционных браузеров уже начали пытаться решить эти проблемы.

Браузеры с искусственным интеллектом лучше справляются с более простыми задачами, такими как обобщение контента на экране или поиск информации в Интернете и ввод найденной информации в онлайн-текстовые редакторы и электронные таблицы.

С момента дебюта Atlas в октябре все изменилось, по крайней мере, с точки зрения внешнего вида. Последняя модель Gemini 3 от Google превосходит лучшие системы искусственного интеллекта OpenAI во многих тестах, что побудило генерального директора Сэма Альтмана объявить «красный код» для улучшения своего флагманского чат-бота. Между тем, игровое поле для браузеров выравнивается по мере того, как Chrome и Microsoft прекращают тестирование инструментов ИИ-агентов для более широкого выпуска в своих традиционных браузерах.

Более того, заставлять онлайн-поставщиков разрабатывать версии своих услуг для ИИ — во многом неблагодарное занятие. Просто спросите OpenAI: этой осенью компания выпустила фреймворк, который позволяет разработчикам приложений интегрировать свои сервисы в своего чат-бота, но разработчики не спешат присоединяться. Хотя такие сервисы, как Zillow, Instacart и Booking.com, запустили пилотные версии своих приложений на ChatGPT, их возможности достаточно ограничены, поэтому пользователям будет лучше обслуживаться с помощью собственных веб-сайтов или приложений. Некоторые девелоперы, такие как Airbnb, говорят, что не торопятся вмешиваться.

Другие компании с высоким трафиком, в том числе Reddit Inc., Amazon.com Inc. и New York Times Co., подали иски, возражая против того, как их контент используется компаниями, занимающимися искусственным интеллектом. В своем иске против Perplexity газета New York Times особо указала на способность Comet предоставлять краткое изложение статей, которые должны быть доступны только платным подписчикам газеты.

Perplexity пообещала противостоять тому, что она считает тактикой запугивания со стороны традиционных поставщиков, которым угрожают стартапы в области искусственного интеллекта.

Для пользователей неразвитость браузеров с искусственным интеллектом может стать препятствием для их более широкого внедрения.

«Искусственный интеллект по-прежнему ненадежен, и если мы собираемся дойти до того, что будем полагаться на агента, который будет тратить деньги от вашего имени, нам придется очень, очень повысить эту надежность», — сказал Чамберс из Mozilla.

«Если я бронирую рейс, как я узнаю, что этот агент действительно предлагает мне лучшее предложение и не получает взятку за бронирование билета на рейс авиакомпании X?» сказала она. «Один из больших рисков, связанных с искусственным интеллектом, заключается в том, что он будет глубоко интегрирован в опыт. И именно поэтому люди очень обеспокоены этим».