[Actualizare: alimentarea restabilită] AWS are o altă întrerupere, provocând probleme cu Amazon, Slack, Imgur, Epic Games Store și multe altele

AWS are o altă întrerupere, provocând probleme cu servicii precum Amazon, Slack, Imgur, Epic Games Store și multe altele. Citiți mai multe aici.

Se pare că porțiuni uriașe ale internetului se luptă chiar acum, inclusiv Slack, Imgur, Epic Games Store și multe altele. Porțiuni uriașe ale internetului depind de Amazon Web Services, cunoscute sub numele de AWS, iar atunci când se confruntă cu probleme, la fel și întregul internet. Dacă ai probleme cu unele dintre site-urile tale preferate, cu siguranță nu ești singur. Alte site-uri afectate includ Coinbase, Hulu și Udemy, pentru a numi câteva.

Rapoartele utilizatorilor au crescut recent Detector de jos. La început, A spus Amazon pe pagina sa de stare AWS că investiga „creșterea eșecurilor de lansare EC2 și problemele de conectivitate la rețea” în zona de disponibilitate USE1-AZ4.

„Investigăm eșecuri crescute de lansare EC2 și probleme de conectivitate la rețea pentru unele cazuri într-o singură zonă de disponibilitate (USE1-AZ4) în regiunea US-EAST-1. Alte zone de disponibilitate din regiunea US-EAST-1 nu sunt afectate de această problemă.”

Cu toate acestea, de atunci, compania a confirmat o întrerupere a curentului în zona de disponibilitate USE1-AZ4.

„Putem confirma o pierdere de energie într-un singur centru de date într-o singură zonă de disponibilitate (USE1-AZ4) din regiunea US-EAST-1. Acest lucru afectează disponibilitatea și conectivitatea la instanțe EC2 care fac parte din centrul de date afectat din zona de disponibilitate afectată. Întâmpinăm, de asemenea, rate de eroare API-uri RunInstance crescute pentru lansările din zona de disponibilitate afectată. Conectivitate și alimentare la alte centre de date din zona de disponibilitate afectată sau alte zone de disponibilitate din regiunea US-EAST-1 nu sunt afectați de această problemă, dar vă recomandăm să renunțați la zona de disponibilitate afectată (USE1-AZ4) dacă puteți face acest lucru. Continuăm să lucrăm pentru a rezolva problema și a restabili alimentarea în centrul de date afectat.”

Întreruperi ca aceasta sunt extrem de rare și foarte puține durează mai mult de o oră. Am văzut câteva întreruperi mai semnificative, deși recent de la like-uri Facebook, și chiar o altă întrerupere de la Amazon doar săptămâna trecută. După cum observă Amazon, compania lucrează în prezent la restabilirea alimentării centrului de date, iar companiile ar trebui să încerce să se îndepărteze de zona de disponibilitate afectată, dacă este posibil.


Actualizare: Amazon spune că a restabilit acum alimentarea majorității instanțelor și a dispozitivelor de rețea

La 5:18 PST, Amazon a confirmat că a restabilit alimentarea majorității instanțelor și a dispozitivelor de rețea.

„Continuăm să facem progrese în restabilirea alimentării la centrul de date afectat din zona de disponibilitate afectată (USE1-AZ4) din regiunea US-EAST-1. Acum am restabilit alimentarea majorității instanțelor și dispozitivelor de rețea din centrul de date afectat și începem să vedem câteva semne timpurii de recuperare. Clienții care se confruntă cu probleme de conectivitate sau de disponibilitate a instanțelor în zona de disponibilitate afectată ar trebui să înceapă să vadă o anumită recuperare pe măsură ce alimentarea este restabilită în centrul de date afectat. Ratele de eroare API RunInstances revin la niveluri normale și lucrăm pentru a recupera instanțele EC2 și volumele EBS afectate. Deși ne-am aștepta la o îmbunătățire continuă în următoarea oră, vă recomandăm totuși să renunțați la zona de disponibilitate dacă puteți face acest lucru pentru a atenua această problemă.”


Actualizarea 2: Amazon spune că toate instanțele și dispozitivele de rețea au fost restabilite

„Acum am restabilit alimentarea tuturor instanțelor și dispozitivelor de rețea din centrul de date afectat și înregistrează o recuperare pentru majoritatea instanțelor EC2 și a volumelor EBS din Disponibilitatea afectată Zona. Conectivitatea la rețea din zona de disponibilitate afectată a revenit, de asemenea, la niveluri normale. În timp ce toate serviciile încep să vadă o recuperare semnificativă, serviciile care găzduiau puncte finale în centrul de date afectat - cum ar fi bazele de date RDS cu un singur AZ, ElastiCache etc. - ar fi avut impact în timpul evenimentului, dar acum încep să vadă o recuperare. Având în vedere nivelul de recuperare, dacă nu ați eșuat încă din zona de disponibilitate afectată, ar trebui să începeți să vedeți recuperarea în această etapă.”