[Обновление: питание восстановлено] В AWS произошел очередной сбой, вызвавший проблемы с Amazon, Slack, Imgur, Epic Games Store и другими

В AWS произошел очередной сбой, вызвавший проблемы с такими сервисами, как Amazon, Slack, Imgur, Epic Games Store и другими. Подробнее читайте здесь.

Похоже, что огромные части Интернета сейчас испытывают трудности, включая Slack, Imgur, Epic Games Store и другие. Огромные части Интернета зависят от веб-сервисов Amazon, известных как AWS, и когда они сталкиваются с проблемами, то же самое происходит и со всем Интернетом. Если у вас возникли проблемы с некоторыми из ваших любимых веб-сайтов, вы определенно не одиноки. Среди других затронутых сайтов — Coinbase, Hulu и Udemy, и это лишь некоторые из них.

Количество пользовательских отчетов в последнее время резко возросло Детектор падения. Сначала, Об этом Amazon сообщил на своей странице статуса AWS. что она расследует «участившиеся сбои при запуске EC2 и проблемы с сетевым подключением» в своей зоне доступности USE1-AZ4.

«Мы расследуем рост числа сбоев при запуске EC2 и проблем с сетевым подключением в некоторых случаях в одной зоне доступности (USE1-AZ4) в регионе US-EAST-1. Другие зоны доступности в регионе US-EAST-1 не затронуты этой проблемой».

Однако с тех пор компания подтвердила отключение электроэнергии в зоне доступности USE1-AZ4.

«Мы можем подтвердить потерю электропитания в одном центре обработки данных в одной зоне доступности (USE1-AZ4) в регионе US-EAST-1. Это влияет на доступность и подключение к экземплярам EC2, которые являются частью затронутого центра обработки данных в затронутой зоне доступности. Мы также наблюдаем повышенное количество ошибок API RunInstance при запусках в затронутой зоне доступности. Возможность подключения и электропитания к другим центрам обработки данных в затронутой зоне доступности или других зонах доступности в регионе US-EAST-1. не затронуты этой проблемой, но мы рекомендуем выйти из затронутой зоны доступности (USE1-AZ4), если вы можете это сделать. Мы продолжаем работать над решением проблемы и восстановлением электроснабжения в пострадавшем центре обработки данных».

Подобные отключения происходят крайне редко, и лишь немногие из них длятся более часа. Однако в последнее время мы наблюдали и более серьезные сбои в работе. из таких, как Facebook, и даже очередной сбой на Amazon только на прошлой неделе. Как отмечает Amazon, в настоящее время компания работает над восстановлением электропитания центра обработки данных, и компаниям следует постараться выйти из пострадавшей зоны доступности, если это возможно.


Обновление: Amazon заявляет, что теперь восстановила подачу электроэнергии к большинству экземпляров и сетевых устройств.

В 5:18 по тихоокеанскому времени Amazon подтвердила, что восстановила электропитание большинства экземпляров и сетевых устройств.

«Мы продолжаем добиваться прогресса в восстановлении электроснабжения пострадавшего центра обработки данных в затронутой зоне доступности (USE1-AZ4) в регионе US-EAST-1. К настоящему времени мы восстановили электропитание большинства экземпляров и сетевых устройств в пострадавшем центре обработки данных и начинаем видеть первые признаки восстановления. Клиенты, испытывающие проблемы с подключением или доступностью экземпляра в затронутой зоне доступности, должны начать наблюдать некоторое восстановление после восстановления электроснабжения затронутого центра обработки данных. Частота ошибок API RunInstances возвращается к нормальному уровню, и мы работаем над восстановлением затронутых экземпляров EC2 и томов EBS. Хотя мы ожидаем дальнейшего улучшения в течение ближайшего часа, мы все равно рекомендуем выйти из зоны доступности, если вы можете это сделать, чтобы смягчить эту проблему».


Обновление 2: Amazon сообщает, что питание было восстановлено для всех экземпляров и сетевых устройств.

«Мы восстановили электропитание всех экземпляров и сетевых устройств в пострадавшем центре обработки данных и наблюдается восстановление большинства экземпляров EC2 и томов EBS в пределах затронутой доступности. Зона. Сетевое подключение в затронутой зоне доступности также вернулось к нормальному уровню. В то время как все службы начинают получать значимое восстановление, службы, которые размещали конечные точки в пострадавшем центре обработки данных, такие как базы данных RDS в одной зоне доступности, ElastiCache и т. д. - ощутили бы влияние во время мероприятия, но сейчас мы начинаем видеть восстановление. Учитывая уровень восстановления, если вы еще не вышли из затронутой зоны доступности, вы должны начать видеть восстановление на этом этапе».