Как модели DeepSeek и Open Code встряхивают индустрию искусственного интеллекта

Технологические компании и академические круги уже давно борются с рисками и преимуществами создания программного обеспечения с открытым исходным кодом. Но одержимость генеративным искусственным интеллектом принесла новое значение к этой дебатах.

DeepSeek и другие китайские компании выпустили волну дешевых, открытых моделей, которые конкурируют с программным обеспечением ведущих американских разработчиков ИИ. В ответ OpenAI — ведущая американская компания по искусству — представила новую открытую модель, первую за шесть лет. Администрация Трампа также призвала американские технологические компании сделать то же самое.

Вот что вам нужно знать.

Что такое открытый код?

В целом, «открытый код» означает программное обеспечение, выходной код которого свободно доступен для всех, кто хочет использовать или изменить его. Согласно Инициативе с открытым исходным кодом (OSI), калифорнийской неправительственной организации, которая защищает этот способ работы — для того, чтобы быть признанным открытым, программное обеспечение должно соответствовать конкретным условиям для распределения и доступа.

Для того, чтобы модель искусственного интеллекта считается действительно открытой, OSI отмечает, что ее разработчики должны предоставить подробную информацию о данных, на которые она обучена, и позволяет людям изучать, использовать и изменять систему для любых целей.

«Закрытый код», напротив, указывает на программное обеспечение и модели, которые контролируются разработчиком, не могут быть изменены и обеспечивают меньшую прозрачность в отношении их технических фундаментов.

Ведущие разработчики программного обеспечения для искусственного интеллекта с предложением с открытым исходным кодом?

Многие технологические компании рекламируют свои решения в области искусственного интеллекта как открытые; Однако не все согласны с тем, что они действительно выполняют это определение.
Meta Platforms Inc., французский стартап Mistral и теперь DeepSeek выпустил модели, которые они называют «Open».

Часто, однако, эти модели на самом деле так называются. Открытые модели. Это означает, что в дополнение к самой модели и, возможно, частью исходного кода, компании раскрывают веса — многие численные значения, которые модель освоила, и на которых она была настроена во время обучения, что позволяет разработчикам настраивать их — но не подробностей о данных, используемых для обучения.

Meta, например, предлагает веса и часть кода серии Llama, но не предоставляет подробную информацию о данных обучения. OSI также критиковала Meta за условия лицензирования, включая определенные ограничения на коммерческое использование.

Аналогичным образом, в январе DeedSeek объявила, что запускает свою последнюю систему R1 в качестве модели с открытым исходным кодом, но не предоставил ни кода, ни обучающие данные. Это подняло вопросы о том, что именно компания использовала для создания своей модели.
OpenAI, несмотря на «Open», в своем названии, не открывает большинство своих моделей. Но вскоре после вирусного успеха Deepseek генеральный директор Openai Сэм Альтман признал, что создатель CHATGPT должен «придумать другую стратегию с открытым исходным кодом». Он добавил: «Лично, я думаю, что мы были на неправильной стороне истории».

В августе Openai запустил две модели-GPT-ASS-12B и GPT-ASS-20B, которые являются открытыми системами, похожими на Llama. Модели свободно доступны на платформе хостинга Agging Face. Они могут имитировать человеческие рассуждения и генерировать текст — но не изображения или видео — в ответ на побуждения пользователей.

Каковы преимущества открытого кода?

Сторонники с открытым исходным кодом обычно указывают, что он более доступен для пользователей, поскольку у него нет одинаковых лицензионных сборов. Более низкие цены расширяют возможности для получения ИИ, а снижение затрат на разработку способствует инновациям. Сторонники также отмечают, что этот подход повышает ответственность разработчиков, которые создают мощные системы ИИ, давая другим возможность лучше понять, как работают модели.

Закрытые системы представляют собой риск создания рынка ИИ, в котором преобладает несколько влиятельных компаний. Генеральный директор компании Cloud Storage Company Box Inc. Аарон Леви сказал: «В мире очень дорогих и поставщиков ИИ имущества ИИ может — и, вероятно, они должны — сохранить всю экономику для себя, сжимая возможности для разработчиков и экосистемы».

Для таких компаний, как Meta, есть также дополнительная выгода от открытого кода: популярность. Позволяя другим разработчикам свободно иметь доступ к программному обеспечению с открытым исходным кодом и обновлению его, Meta смогла расширить свое влияние на всю экосистему ИИ.

Каковы риски открытых систем?

Критики открытого кода говорят, что это более неопределенно. В случае ИИ некоторые в Соединенных Штатах опасаются, что использование аналогичных моделей такими конкурентами, как Китай, представляет риск для национальной безопасности и угрожает безопасности граждан. Например, модели, которые собирают огромные объемы пользовательских данных, могут использоваться для мониторинга. Кроме того, есть опасения, что американские компании, предлагающие свои модели различной открытости ИИ, потенциально могут дать конкурентным странам возможность использовать их для технологического обгнания Соединенных Штатов.

Почему DeepSeek выбрал «открытую» дорогу?

Приняв более открытый подход (с некоторыми оговорками), DeepSeek, возможно, снизил проблемы глобальных пользователей по поводу строгого контроля Китая над технологиями. Стартап, возможно, также расширил масштаб своего чат -бота на западных рынках, что помогло другим разработчикам адаптировать основные технологии к своим собственным потребностям.

Другими словами, Deepseek практически следует той же стратегии, которую Meta использует для захвата большей части экосистемы AI-Ecosystem-A, который явно не ускользнул от генерального директора Meta Марка Цукерберга.

«Это огромное геополитическое соперничество, и Китай бросает себя чрезвычайно агрессивно», — сказал Цукерберг в интервью The Joe Rogan Experience. «Если есть модель с открытым исходным кодом, которую каждый может использовать, мы хотели бы, чтобы она была американской».

Как работает модель DeepSeek AI?

Как и некоторые из последних моделей ведущих американских разработчиков, включая OpenAI, и Google-R1 DeepSeek предназначены для того, чтобы имитировать то, как люди иногда размышляют о проблеме, потратив время на расчет ответа, прежде чем ответить на запросы пользователей. Версия DeepSeek, построенная на одной из недавно запущенных моделей компании — V3, отличается от своих американских конкурентов в своей эффективности.

Команда, стоящая за ней, работала инновационно. В то время как соперники использовали огромное количество мощных чипов для создания аналогичных моделей искусственного интеллекта, члены команды Depepeek, очевидно, нашли способы эффективного использования относительно мало более старых чипов, которые они имели доступ к ограничениям экспорта в США на самые авангардные полупроводники. Кроме того, они сильно полагались на технику, известную как обучение подкреплению, которая вознаграждает систему правильных ответов и наказывает ее за неправильные.

В Соединенных Штатах некоторые технологические и политические лидеры признали эти достижения, но в то же время подняли вопросы о том, создала ли китайская компания позаботиться на основе западных технологий, избегая некоторых огромных затрат на разработку крупных языковых моделей — строительные блоки чатов.

Что представители штата говорят об открытом коде?

После рассмотрения в 2024 году администрация тогдашнего предпринимателя Джо Байдена пришел к выводу, что было преждевременно навязывать ограничения на открытые модели ИИ, но в будущем оставляло возможность для таких мер.

Администрация Дональда Трампа выразила некоторую поддержку моделям с открытым исходным кодом и открытыми весами, вероятно, в ответ на опасения по поводу роста китайского искусственного интеллекта. В Законе о Трампе ИИ, опубликованном в июле, Белый дом поощряет разработку открытых моделей, указывая на их потенциал «стать глобальными стандартами» для бизнеса и академических исследований. «По этой причине, — говорит план, — они также имеют геостратегическую ценность».