[อัปเดต: กู้คืนพลังงานแล้ว] AWS เกิดการหยุดทำงานอีกครั้ง ทำให้เกิดปัญหากับ Amazon, Slack, Imgur, Epic Games Store และอีกมากมาย

AWS ประสบปัญหาหยุดทำงานอีกครั้ง ทำให้เกิดปัญหากับบริการต่างๆ เช่น Amazon, Slack, Imgur, Epic Games Store และอื่นๆ อ่านเพิ่มเติมได้ที่นี่

ดูเหมือนว่าอินเทอร์เน็ตส่วนใหญ่กำลังประสบปัญหาในขณะนี้ รวมถึง Slack, Imgur, Epic Games Store และอีกมากมาย อินเทอร์เน็ตส่วนใหญ่ต้องพึ่งพา Amazon Web Services หรือที่เรียกว่า AWS และเมื่อประสบปัญหา อินเทอร์เน็ตทั้งหมดก็พึ่งพาเช่นกัน หากคุณกำลังประสบปัญหากับเว็บไซต์โปรดบางแห่ง คุณไม่ได้อยู่คนเดียวอย่างแน่นอน เว็บไซต์อื่นๆ ที่ได้รับผลกระทบ ได้แก่ Coinbase, Hulu และ Udemy เป็นต้น

รายงานผู้ใช้ถูกเพิ่มเข้ามาเมื่อเร็ว ๆ นี้ เครื่องตรวจจับลง. ตอนแรก, Amazon กล่าวในหน้าสถานะ AWS กำลังตรวจสอบ "ความล้มเหลวในการเปิดตัว EC2 ที่เพิ่มขึ้นและปัญหาการเชื่อมต่อเครือข่าย" ในโซนความพร้อมใช้งาน USE1-AZ4

“เรากำลังตรวจสอบความล้มเหลวในการเปิดตัว EC2 ที่เพิ่มขึ้นและปัญหาการเชื่อมต่อเครือข่ายสำหรับบางอินสแตนซ์ใน Availability Zone เดียว (USE1-AZ4) ในภูมิภาค US-EAST-1 Availability Zone อื่นๆ ภายในภูมิภาค US-EAST-1 ไม่ได้รับผลกระทบจากปัญหานี้"

อย่างไรก็ตาม ตั้งแต่นั้นเป็นต้นมา บริษัทได้ยืนยันการไฟฟ้าดับในโซนพร้อมใช้งาน USE1-AZ4

“เราสามารถยืนยันการสูญเสียพลังงานภายในศูนย์ข้อมูลแห่งเดียวภายใน Availability Zone เดียว (USE1-AZ4) ในภูมิภาค US-EAST-1 สิ่งนี้ส่งผลต่อความพร้อมใช้งานและการเชื่อมต่อกับอินสแตนซ์ EC2 ซึ่งเป็นส่วนหนึ่งของศูนย์ข้อมูลที่ได้รับผลกระทบภายใน Availability Zone ที่ได้รับผลกระทบ นอกจากนี้ เรายังพบอัตราข้อผิดพลาด RunInstance API ที่เพิ่มขึ้นสำหรับการเปิดตัวภายใน Availability Zone ที่ได้รับผลกระทบ การเชื่อมต่อและพลังงานไปยังศูนย์ข้อมูลอื่นๆ ภายใน Availability Zone ที่ได้รับผลกระทบ หรือ Availability Zone อื่นๆ ภายในภูมิภาค US-EAST-1 ไม่ได้รับผลกระทบจากปัญหานี้ แต่เราขอแนะนำให้คุณละทิ้ง Availability Zone ที่ได้รับผลกระทบ (USE1-AZ4) หากคุณสามารถทำได้ เรายังคงทำงานต่อไปเพื่อแก้ไขปัญหาและฟื้นฟูพลังงานภายในศูนย์ข้อมูลที่ได้รับผลกระทบ"

การหยุดทำงานเช่นนี้เกิดขึ้นได้น้อยมาก และมีน้อยมากที่จะเกิดขึ้นนานกว่าหนึ่งชั่วโมง เราได้เห็นการหยุดทำงานที่สำคัญบางอย่างเมื่อเร็ว ๆ นี้ จากการกดไลค์บน Facebookและแม้กระทั่งการหยุดทำงานของ Amazon อีกครั้ง เมื่อสัปดาห์ที่แล้ว. ตามที่ Amazon ตั้งข้อสังเกต บริษัทกำลังดำเนินการเพื่อฟื้นฟูพลังงานให้กับศูนย์ข้อมูล และบริษัทต่างๆ ควรพยายามถอยออกจากโซนความพร้อมใช้งานที่ได้รับผลกระทบหากเป็นไปได้


อัปเดต: Amazon กล่าวว่าขณะนี้ได้คืนพลังงานให้กับอินสแตนซ์และอุปกรณ์เครือข่ายส่วนใหญ่แล้ว

เมื่อเวลา 5:18 PST Amazon ยืนยันว่าได้คืนพลังงานให้กับอินสแตนซ์และอุปกรณ์เครือข่ายส่วนใหญ่แล้ว

“เรายังคงเดินหน้าดำเนินการฟื้นฟูพลังงานให้กับศูนย์ข้อมูลที่ได้รับผลกระทบภายใน Availability Zone ที่ได้รับผลกระทบ (USE1-AZ4) ในภูมิภาค US-EAST-1 ขณะนี้เราได้คืนพลังงานให้กับอินสแตนซ์และอุปกรณ์เครือข่ายส่วนใหญ่ภายในศูนย์ข้อมูลที่ได้รับผลกระทบแล้ว และเริ่มเห็นสัญญาณการฟื้นตัวเบื้องต้น ลูกค้าที่ประสบปัญหาการเชื่อมต่อหรือความพร้อมใช้งานของอินสแตนซ์ภายใน Availability Zone ที่ได้รับผลกระทบ ควรเริ่มเห็นการกู้คืนบางส่วนเมื่อมีการจ่ายไฟกลับคืนสู่ศูนย์ข้อมูลที่ได้รับผลกระทบ อัตราข้อผิดพลาด RunInstances API กำลังกลับสู่ระดับปกติ และเรากำลังดำเนินการกู้คืนอินสแตนซ์ EC2 และไดรฟ์ข้อมูล EBS ที่ได้รับผลกระทบ แม้ว่าเราคาดว่าจะมีการปรับปรุงอย่างต่อเนื่องในชั่วโมงข้างหน้า แต่เรายังคงแนะนำให้เลิกใช้ Availability Zone หากคุณสามารถทำได้เพื่อลดปัญหานี้"


อัปเดต 2: Amazon กล่าวว่าพลังงานได้รับการกู้คืนไปยังอินสแตนซ์และอุปกรณ์เครือข่ายทั้งหมดแล้ว

"ตอนนี้เราได้คืนพลังงานให้กับอินสแตนซ์และอุปกรณ์เครือข่ายทั้งหมดภายในศูนย์ข้อมูลที่ได้รับผลกระทบแล้วและ จะเห็นการกู้คืนสำหรับอินสแตนซ์ EC2 ส่วนใหญ่และไดรฟ์ข้อมูล EBS ภายในความพร้อมใช้งานที่ได้รับผลกระทบ โซน. การเชื่อมต่อเครือข่ายภายใน Availability Zone ที่ได้รับผลกระทบก็กลับสู่ระดับปกติเช่นกัน ในขณะที่บริการทั้งหมดเริ่มเห็นการกู้คืนที่มีความหมาย บริการที่โฮสต์จุดสิ้นสุดภายในศูนย์ข้อมูลที่ได้รับผลกระทบ เช่น ฐานข้อมูล AZ RDS เดียว, ElastiCache เป็นต้น - น่าจะเห็นผลกระทบระหว่างจัดงาน แต่ตอนนี้เริ่มเห็นการฟื้นตัวแล้ว เมื่อพิจารณาถึงระดับการฟื้นตัว หากคุณยังไม่ล้มเหลวในการออกจาก Availability Zone ที่ได้รับผลกระทบ คุณควรเริ่มเห็นการฟื้นตัวในขั้นตอนนี้"