Предоставлено: иллюстрация Тоби Декстера.
Кристоферу Мейкледжону было всего 19 лет в ту ночь, когда ему пришлось проехать через метель на Honda Civic, чтобы перезагрузить сервер.
Это было 19 января 2002 года, он работал в центре обработки данных в Бостоне, в котором находился интернет-магазин New England Patriots.
Его работа заключалась в том, чтобы лично посетить сервер, чтобы исправить это в тот день, когда «Патриоты» сыграли решающую домашнюю игру против «Оклендских рейдеров».
Ему удалось это сделать как раз вовремя, но он вспоминает, как из-за обострения снега на обратном пути он оказался в затруднительном положении, не имея возможности вернуться домой.
Сегодня он благодарен, что такая трудная задача была взята из его рук. «Это большая часть того, за что мы платим поставщикам облачных услуг, не так ли?» — говорит Мейкледжон, сейчас кандидат наук в Университете Карнеги-Меллона, изучающий, как сделать Интернет более устойчивым. «Мы платим больше, потому что они делают все это за нас».
В прошлый вторник миллионы пользователей Интернета и тысячи веб-сайтов остро напомнили о недостатках этого механизма.
Отключение, которое на короткое время перекрыло доступ к Amazon, Reddit, Boots, The Guardian, Financial Times, Белому дому США и всем веб-сайтам Gov.uk, произошло не из-за ненастной погоды, а из-за единственной американской компании облачных вычислений под названием Fastly — one из горстки, которые незаметно объединили удивительную долю скрытой сантехники в Интернете.
Некоторые участки Интернета, включая Amazon, Reddit и многие новостные агентства, во вторник были отключены из-за сбоя в относительно малоизвестной компании, занимающейся облачными вычислениями. Предоставлено: Леон Нил / Getty Images.
Согласно данным картографической компании Intricately, Fastly — это просто пятая по величине «сеть доставки контента» (CDN), особый тип облачной службы, которая обеспечивает цифровую ликвидность меньшим службам, которые не могут легко справиться с скачками пропускной способности самостоятельно.
Три крупнейших — Cloudflare, Amazon Web Services (AWS) и Akamai — контролируют примерно 89% этого рынка, и с 2010 года все три страдают от серьезных сбоев.
Эти компании являются лишь одним из уголков разросшегося по всему миру аппарата, столь же непрозрачного и непонятного для большинства пользователей, как банковская система до краха 2008 года. И, как показал Фастли, большая часть Интернета теперь может оказаться на расстоянии одного домино от краха.
«Мы склонны забывать, что тот факт, что Интернет работает каждый день, близок к чуду», — говорит Коринн Кат-Спет, антрополог из Оксфордского института Интернета, изучающая влияние инфраструктуры Интернета на политическую власть.
«Мы думаем об этом как об эфемерной вещи — мы буквально говорим об« облаках ». Но облака — это серверы, облака — это то, что вы можете пнуть, облака — большие, гудящие машины, которые стоят в комнатах, которые нужно охлаждать … для этого нужно так много людей, для этого нужны все эти автономные сети.
«Все время что-то идет не так, но мы, как потребители, привыкли к удобству работы. И поскольку это так важно, как повседневная инфраструктура, это нас пугает ».
Fastly сказал, что новая конфигурация сервиса вызвала волну сбоев в работе так называемых «POP» — серверов, на которых хранятся кэшированные копии веб-страниц для ускорения доступа, в результате чего пользователи не могли получить доступ к определенным сайтам. Предоставлено: AP Photo / Марсио Хосе Санчес.
Первоначально Интернет был построен для соединения различных компьютеров и сетей, при этом многие веб-сайты просто размещались на личных машинах их владельцев.
Те, которые были представлены в популярных блогах, таких как Slashdot и Digg, часто падали под тяжестью нового трафика.
Мейкледжон вспоминает, что для Бостонского марафона 2005 года ему пришлось доставить и подключить тяжелую стойку с серверами в качестве временной емкости для электронной почты. Однако в то десятилетие веб-сайты начали заполняться изображениями и видео, что привело к резкому увеличению требований к пропускной способности.
Сети CDN решают эти проблемы с помощью всемирного парка серверов, которые могут быстро доставлять контент пользователям из своих стран, гибко преодолевая внезапные потрясения и объединяя затраты на поддержание резервных мощностей.
Кат-Спет говорит, что они склонны к концентрации рынка, потому что это зависит от огромной пропускной способности, экономии на масштабе, дорогих физических центров обработки данных и серьезного таланта в программировании.
Ничто не остается неизменным вечно, и поэтому в этой торговле риск количественно оценивается «девятками» — договорной гарантией, позволяющей поддерживать работу каждого клиента в течение, возможно, четырех девяток (99,99 процента) или пяти девяток (99,999 процента) в год. «Что означает, что нужно предвидеть неудачу, верно?» — говорит Мейкледжон. «Компания буквально говорит вам, что это может длиться так долго, и вы ничего не можете сделать».
Некоторые компании подстраиваются под это: Netflix постоянно готовится к потере целого «региона» AWS, из которых шесть в Европе.
Тем не менее, руководитель Мейклеона Хизер Миллер говорит, что многие из тех, кто создает сервисы в облаке, не осознают риск, поскольку он распределен по всей системе.
«Вместо 50 скрытых связей между различными компаниями, мы говорим о миллионах. Мы просто не видим масштабов этого », — говорит она. «Очень сложно свалить вину на кого, потому что график такой большой».
Часовой сбой Fastly на прошлой неделе был вызван тем, что один клиент обновил свои настройки. Это привело к ошибке в коде Fastly, из-за которой вышло из строя 85% сети компании.
Мы определили конфигурацию службы, которая вызвала сбои в работе наших POP во всем мире, и отключили эту конфигурацию. Наша глобальная сеть снова в сети. Продолжение статуса доступно на https://t.co/RIQWX0LWwl.
— Fastly (@fastly) 8 июня 2021 г.
ParcelHero, компания по доставке электронной коммерции, оценивает, что розничные торговцы в Великобритании, Европе и США потеряют около 1 миллиарда фунтов стерлингов из-за отключения.
«Только Amazon в настоящее время оборачивает более 950 000 долларов в минуту», — говорит Дэвид Джинкс, руководитель отдела потребительских исследований ParcelHero. «Это был один из самых быстрых сайтов, которые снова подключились к сети, но некоторые организации не работали около часа».
По словам Кат-Спет, это высокая цена, но последствия сбоя онлайн-систем могут оказаться гораздо более серьезными.
«Это раздражает, если вы не можете посмотреть последний эпизод« Короны », — говорит она. «Это прискорбно. Но что, если сегодня вы пытались записаться на прием для вакцинации против Covid-19, а веб-сайт не работал? Итак, вы не сделали прививку, и завтра вы заразитесь Covid, а на следующий день после вашей смерти? »
Уязвимы не только CDN. Центры обработки данных, подводные кабели, телекоммуникационные сети и сторонние поставщики программного обеспечения — это лишь несколько областей, которые могут подвергаться риску сбоев в результате кибератак или стихийных бедствий.
«Интернет не был рассчитан на доставку большого количества данных с той скоростью, на которой мы хотим, — говорит Гэв Винтер, генеральный директор компании по обеспечению безопасности Rapidspike.
«Более 70% покупателей признаются, что покидают веб-сайты, потому что что-то загружается дольше, чем несколько секунд, однако вы оставляете себя уязвимым для таких катастрофических сбоев».
«Основная инфраструктура должна измениться, стать более устойчивой и децентрализованной», — добавляет он.
Тем не менее, несмотря на все риски, присущие нашим онлайн-системам, большую часть времени Интернет работает. Возможно, именно поэтому правительства и политики до сих пор не ставили своей задачей повышение устойчивости системы.
Кат-Спет, однако, считает, что наличие нескольких контрактов CDN должно быть юридическим требованием для правительств: «Очевидно, что было много правительственных веб-сайтов или много правительственных организаций, которые либо не принимали это во внимание, либо считали, что это слишком дорого.»
Однако мир вскоре мог узнать истинную цену отсутствия подготовки. Винтер считает, что в ближайшем будущем может произойти гораздо более серьезный сбой:
«Потенциал этого вполне реален … и следующий может быть намного хуже».
Свежие комментарии