Почему Интернет сегодня так уязвим

  • На мировом рынке доминирует небольшое количество поставщиков облачных услуг: AWS, Microsoft Azure, Google Cloud контролируют более 70% сервисов.
  • Взаимосвязь технологических услуг увеличивает риск
  • Сбои в работе облачных платформ затронули миллионы пользователей.

Для большей части мира термин «оффлайн» больше не существует.

Интернет лежит в основе глобальной финансовой и потребительской экосистемы и обеспечивает мгновенную связь и транзакции.

Хотя система является неотъемлемой частью многих видов человеческой деятельности, она остается уязвимой, и когда какая-то ее часть перестает функционировать, это обходится в миллиарды долларов и причиняет серьезные неудобства.

В 2025 году массовые обвалы участились. Технические проблемы у крупных поставщиков веб-инфраструктуры привели к перебоям в обслуживании миллионов пользователей.

15-часовой сбой в центрах обработки данных Amazon.com Inc. в октябре он заблокировал доступ британских детей к игровой платформе Roblox, запретил работникам совершать звонки через Zoom и заставил дежурных инженеров в Индии отменить планы на религиозный праздник Дивали.

В середине ноября из-за сбоя в Cloudflare Inc. были отключены несколько сайтов, в том числе ChatGPT, Транспортное управление Нью-Джерси и социальная платформа X.

Может показаться странным, что проблема с одним поставщиком может вызвать такой каскад повреждений.

Причина кроется в том, как развивался Интернет с момента его создания, а также в сокращении затрат и эффективности компаний, услугами которых полагаются миллионы пользователей.

Как пользователи получают доступ к Интернету?

Когда пользователь из Великобритании заходит на сайт google.com на своем телефоне или компьютере, начинается сложный, но молниеносный процесс.

Все устройства — телефоны, компьютеры, серверы — которые подключены к Интернету, имеют идентификаторы, называемые IP-адресами, и используют систему доменных имен (DNS) для обнаружения и связи друг с другом.

Между тем, сайты и приложения, такие как Google, состоят из пакетов данных — текста, изображений и файлов.

Чтобы взимать плату с Google, устройство пользователя запрашивает эти пакеты данных через Wi-Fi, мобильную сеть или проводное соединение.

Запрос проходит через физическую инфраструктуру, такую ​​как маршрутизаторы, кабели, коммутаторы, региональные центры обработки данных и, возможно, подводные кабели, пока не достигнет нужного сервера Google.

Этот сервер, расположенный в дата-центре среди сотен тысяч других серверов Google, обрабатывает запрос и возвращает пользователю необходимые пакеты через те же глобальные сети.

Обрывы могут произойти в любом месте этой взаимосвязанной цепи. И одна из главных причин, почему сбои сегодня имеют такие далеко идущие последствия, — это развитие облачных сервисов.

Почему перебои в подаче электроэнергии вызывают такие толчки?

Основное изменение в работе Интернета связано с тем, где хранятся данные и инфраструктура.

В 1990-х и начале 2000-х годов любая компания, имевшая собственный веб-сайт, наверняка имела и собственные серверы в своих офисах — так называемые локальные серверы. Альтернативой была аренда серверов у других компаний, но при этом самостоятельно управлять аппаратным и программным обеспечением.

На уровне отдельного пользователя любая деятельность, связанная с компьютером, подразумевала локальное хранилище: музыка, фотографии, файлы хранились на жестких дисках.

Сбой мог произойти только из-за одного испорченного файла, а потеря нескольких тысяч фотографий была бы неприятной, но не коснулась бы других пользователей.

Облачные сервисы стали мейнстримом после того, как компания Amazon, до этого известная в первую очередь как онлайн-торговля, обнаружила, что ее инженеры тратят много времени на решение одних и тех же проблем с инфраструктурой и хранением данных.

Компания создала общую инфраструктуру, чтобы уменьшить эту нагрузку, и поняла, что эту концепцию можно применить к большей части Интернета.

Идея быстро прижилась, и сегодня большинство интернет-пользователей и предприятий полагаются на облачные сервисы. После Amazon Web Services корпорации Microsoft и Google (Alphabet Inc.) запустили свои собственные платформы, и эти три компании доминируют на мировом рынке облачных технологий.

На практике это означает эксплуатацию миллионов серверов в центрах обработки данных.

Обычно они организованы в «регионы» — отдельные кластеры серверных ферм, обслуживающие определенную страну или территорию.

Некоторые регионы поглощают гораздо больше трафика, что значительно усугубляет последствия возможной аварии.

Некоторые компании могут даже не знать о региональных зависимостях в своей собственной инфраструктуре, что приводит к сбоям в обслуживании из-за сбоев в работе за пределами их региона.

Авария AWS в октябре была вызвана ошибкой в ​​одном из ее ключевых сервисов, что привело к массовым сбоям в работе и сбоям в работе ряда крупных сайтов и сервисов.

Поскольку Интернет — это не только пакеты данных, но и огромная физическая инфраструктура, подобные инциденты могут быть следствием программного сбоя, перегрева дата-центра или повреждения кабеля.

Удивительно, что сбои случаются не так часто.

Почему облачные платформы, такие как AWS, Microsoft Azure и Google Cloud, настолько доминируют?

Например, в Великобритании AWS и Azure занимают более 70% рынка облачных услуг.

Это результат преимущества первопроходцев, многолетнего присутствия Microsoft в сфере корпоративных технологий и огромных финансовых ресурсов этих компаний.

Однако зависимость от нескольких доминирующих поставщиков имеет некоторые последствия.

Авария теперь может блокировать целые части Интернета.

Гипермасштабные компании, как их стали называть, также подвергались критике за деловую практику, которая затрудняет выход на рынок новых конкурентов и переключение клиентов на других поставщиков.

Поскольку технологическая инфраструктура каждого поставщика облачных услуг различна, смена платформ может оказаться чрезвычайно дорогостоящей.

Облачные инженеры часто завершают программы сертификации только для одного конкретного поставщика, что еще больше увеличивает стоимость и сложность диверсификации.

Что может пойти не так с большими облачными сервисами?

Одна из причин популярности крупных облачных провайдеров заключается в их надежности.

Облачные услуги — один из наиболее быстрорастущих сегментов их бизнеса, и в их интересах обеспечить бесперебойную работу систем.

Но это не компенсирует растущую взаимосвязанность технологических услуг, особенно когда всего несколько компаний доминируют на разных уровнях инфраструктуры.

Например, CrowdStrike Holdings Inc. не является технологическим гигантом, но является лидером в области кибербезопасности.

Его популярность означает, что его продукты работают на миллионах систем Microsoft Windows, часто выполняющих критически важные процессы в крупных организациях.

Когда в июле 2024 года компания распространила ошибочное обновление программного обеспечения через облачное обновление, это мгновенно вызвало «синие экраны смерти» на миллионах компьютеров.

Хотя проблема была не в облаке, одновременный характер облачных обновлений одновременно вывел из строя миллионы компьютеров.

Пустой цифровой

Рекламные щиты в Нью-Йорке после неудачного обновления CrowdStrike

Что могут сделать компании, чтобы защитить себя от риска сбоев?

Самое главное, что у них есть заблаговременный план действий на случай сбоя.

Это может означать более высокие затраты на службу резервного копирования, если их основной регион выйдет из строя, или адаптацию инфраструктуры для наличия «внутренних» серверов резервного копирования для наиболее важных операций.

Что касается других пользователей, то во время серьезного сбоя им нечего делать, кроме как ждать, пока поставщик облачных услуг устранит проблему.

Иногда лучше отойти от экрана, перевести дух и подумать о сложной инфраструктуре компьютера, которая (в большинстве случаев) обеспечивает бесперебойную работу всего.