Как тензорные процессоры Google серьезно конкурируют с Nvidia

  • Тензорные процессоры Google (TPU) привлекают крупных клиентов и зарекомендовали себя как реальная альтернатива графическим процессорам Nvidia для обучения.
  • Ironwood (7-го поколения) обеспечивает более высокую производительность и меньшие затраты на электроэнергию благодаря конфигурациям до 9216 чипов.
  • Несмотря на растущий интерес к TPU, Nvidia остается ключевым игроком: гибкость графических процессоров и масштаб спроса требуют «смешанного» подхода.

Клиенты уже давно призывают к усилению конкуренции на рынке чипов искусственного интеллекта, где доминирует Nvidia Corp. Оказывается, одна из самых серьезных альтернатив все это время была «перед нашими глазами».

Десять лет назад Google выпустила свои тензорные процессоры (TPU), чтобы ускорить работу поисковой системы и повысить ее производительность. Позже они были адаптированы для машинного обучения в приложениях Google для искусственного интеллекта.

Сегодня компания заключает крупные сделки по TPU, предполагая, что они могут стать надежной альтернативой ускорителям Nvidia для обучения и запуска современных моделей больших языков (LLM). Ускорители Nvidia называются графическими процессорами (GPU).

Ниже вы узнаете больше о TPU, о том, как они работают, что обещают и в чем заключаются их ограничения.

В чем разница между графическим процессором и ТПУ

Оба типа чипов могут выполнять огромное количество вычислений, связанных с обучением моделей ИИ, но они выполняют это по-разному. Графические процессоры Nvidia изначально были разработаны для фотореалистичной графики в видеоиграх, параллельно обрабатывая множество задач с помощью тысяч ядер. Эта архитектура позволяет им выполнять задачи ИИ со скоростями, которых с трудом достигают конкурирующие технологии.

TPU созданы специально для операций умножения матриц — основного действия при обучении нейронных сетей, которые генерируют ответы в чат-ботах, таких как ChatGPT OpenAI и Claude от Anthropic PBC. Большая часть этой работы включает в себя повторяющиеся вычисления, выполняемые последовательно, и TPU предназначены для эффективного их выполнения.

Они считаются менее адаптивными и более специализированными, чем графические процессоры Nvidia, но при этом более энергоэффективны в этих операциях. Графические процессоры более гибкие и программируемые, но эта гибкость может сделать их более дорогими в эксплуатации.

Как ТПУ стали серьезными кандидатами в области искусственного интеллекта

Google начала работу над своим первым TPU в 2013 году и выпустила его два года спустя. Изначально это ускоряет работу поисковой системы и повышает эффективность. Начиная с 2018 года Google также начала предлагать TPU на своей облачной платформе, позволяя клиентам использовать ту же технологию, которая ускоряет поиск.

Чипы также адаптированы для внутренней разработки Google в области искусственного интеллекта. В то время как компания и ее подразделение DeepMind создают флагманские модели, такие как Gemini, знания, полученные от команд искусственного интеллекта, передаются разработчикам TPU, которые, в свою очередь, настраивают чипы для пользы внутренних команд.

Последняя версия — TPU Ironwood — была представлена ​​в апреле. Он доступен в конфигурации с 256 чипами или в гораздо более крупной версии с 9216 чипами.

TPU могут превосходить графические процессоры в некоторых задачах искусственного интеллекта, потому что Google может «убрать множество других частей чипа», которые не предназначены для искусственного интеллекта, говорит аналитик Seaport Джей Голдберг, который редко поддерживает рекомендацию о продаже Nvidia. Теперь, в седьмом поколении, Google увеличил производительность, увеличил мощность и снизил энергопотребление, что снижает стоимость владения.

Кто использует ТПУ и каковы перспективы продаж

Среди текущих клиентов ТПУ — стартап Safe Superintelligence, основанный в прошлом году сооснователем OpenAI Ильей Суцкевером, а также Salesforce Inc., Midjourney и Anthropic.

В рамках сделки, объявленной в октябре, Anthropic получает доступ к более чем одному гигаватту вычислительной мощности посредством до 1 миллиона TPU. В следующем месяце The Information сообщила, что компания Meta Platforms Inc. ведет переговоры об использовании TPU Google в своих центрах обработки данных в 2027 году. Эти события показывают, как крупные игроки в области ИИ используют TPU, спеша наращивать мощности для удовлетворения растущего спроса.

Крупнейшие разработчики ИИ тратят десятки миллиардов долларов на дорогие чипы Nvidia и ищут способ ограничить зависимость и смягчить эффект нехватки, что указывает на значительный рыночный потенциал ТПУ.

На данный момент предприятиям, желающим использовать TPU, приходится арендовать вычислительные мощности в облаке Google, но вскоре это может измениться. По мнению аналитиков Bloomberg Intelligence, сделка Anthropic делает расширение в другие облака более вероятным.

Никто, включая Google, не собирается полностью заменить графические процессоры Nvidia; темпы развития ИИ в настоящее время не позволяют этого сделать. Google остается одним из крупнейших клиентов Nvidia, поскольку ей необходимо сохранять гибкость для клиентов, говорит Гаурава Гупта из Gartner.

Если алгоритм или модель клиента меняются, графические процессоры лучше подходят для широкого спектра рабочих нагрузок. «Nvidia на поколение опережает отрасль», — заявил представитель Nvidia. «Мы воодушевлены успехом Google — они добились больших успехов в области искусственного интеллекта, и мы продолжаем предоставлять услуги Google».

Даже компании, которые выбирают TPU, продолжают активно использовать чипы Nvidia. Anthropic, например, объявила о крупной сделке с Nvidia через несколько недель после соглашения TPU с Google. Наиболее реалистичная перспектива для TPU Google — стать частью «корзины» технологий, необходимых для развития искусственного интеллекта.