[Atualização: energia restaurada] AWS está tendo outra interrupção, causando problemas com Amazon, Slack, Imgur, Epic Games Store e muito mais

A AWS está passando por outra interrupção, causando problemas em serviços como Amazon, Slack, Imgur, Epic Games Store e muito mais. Leia mais aqui.

Parece que grande parte da Internet está passando por dificuldades agora, incluindo Slack, Imgur, a Epic Games Store e muito mais. Grandes porções da Internet dependem da Amazon Web Services, conhecida como AWS, e quando enfrentam problemas, toda a Internet também enfrenta. Se estiver tendo problemas com alguns de seus sites favoritos, você definitivamente não está sozinho. Outros sites afetados incluem Coinbase, Hulu e Udemy, para citar alguns.

Relatórios de usuários aumentaram recentemente em Detector de queda. Inicialmente, Amazon disse em sua página de status da AWS que estava investigando “aumento de falhas de inicialização do EC2 e problemas de conectividade de rede” em sua zona de disponibilidade USE1-AZ4.

“Estamos investigando o aumento de falhas de inicialização do EC2 e problemas de conectividade de rede para algumas instâncias em uma única zona de disponibilidade (USE1-AZ4) na região US-EAST-1. Outras zonas de disponibilidade na região US-EAST-1 não são afetadas por este problema."

Porém, desde então, a empresa confirmou uma queda de energia na zona de disponibilidade USE1-AZ4.

“Podemos confirmar uma perda de energia em um único data center em uma única zona de disponibilidade (USE1-AZ4) na região US-EAST-1. Isso está afetando a disponibilidade e a conectividade às instâncias do EC2 que fazem parte do data center afetado na zona de disponibilidade afetada. Também estamos enfrentando taxas de erro elevadas da API RunInstance para lançamentos na zona de disponibilidade afetada. Conectividade e energia para outros data centers na zona de disponibilidade afetada ou em outras zonas de disponibilidade na região US-EAST-1 não são afetados por esse problema, mas recomendamos sair da zona de disponibilidade afetada (USE1-AZ4) se você puder fazer isso. Continuamos trabalhando para resolver o problema e restaurar a energia no data center afetado."

Interrupções como essa são extremamente raras e poucas duram mais de uma hora. Vimos algumas interrupções mais significativas recentemente de pessoas como o Facebooke até outra interrupção da Amazon semana passada. Como observa a Amazon, a empresa está atualmente trabalhando para restaurar a energia do data center e as empresas devem tentar sair da zona de disponibilidade afetada, se possível.

Atualização: a Amazon afirma que agora restaurou a energia para a maioria das instâncias e dispositivos de rede

Às 5h18 PST, a Amazon confirmou que restaurou a energia para a maioria das instâncias e dispositivos de rede.

“Continuamos a progredir na restauração da energia do data center afetado na zona de disponibilidade afetada (USE1-AZ4) na região US-EAST-1. Agora restauramos a energia para a maioria das instâncias e dispositivos de rede no data center afetado e estamos começando a ver alguns sinais iniciais de recuperação. Os clientes que enfrentam problemas de conectividade ou disponibilidade de instância na zona de disponibilidade afetada deverão começar a ver alguma recuperação à medida que a energia for restaurada no data center afetado. As taxas de erro da API RunInstances estão retornando aos níveis normais e estamos trabalhando para recuperar instâncias EC2 e volumes EBS afetados. Embora esperemos melhorias contínuas nas próximas horas, ainda assim recomendamos sair da zona de disponibilidade se você puder fazer isso para mitigar esse problema."

Atualização 2: Amazon diz que a energia foi restaurada para todas as instâncias e dispositivos de rede

“Agora restauramos a energia para todas as instâncias e dispositivos de rede no data center afetado e estão vendo recuperação para a maioria das instâncias EC2 e volumes EBS dentro da Disponibilidade afetada Zona. A conectividade de rede na zona de disponibilidade afetada também voltou aos níveis normais. Embora todos os serviços estejam começando a ter uma recuperação significativa, os serviços que hospedavam endpoints no data center afetado - como bancos de dados RDS single-AZ, ElastiCache, etc. - teriam sofrido impacto durante o evento, mas estão começando a ver recuperação agora. Dado o nível de recuperação, se você ainda não conseguiu sair da zona de disponibilidade afetada, deverá começar a ver a recuperação neste estágio."