Чому через збій у роботі Facebook багато співробітників залишили свої офіси

click fraud protection

Через збій у Facebook багато співробітників залишили свої офіси, але як це сталося? Ми детально зануримося та пояснимо, як.

Facebook, Instagram і WhatsApp вчора все впало. Ви, напевно, чули про це, враховуючи, що не тільки ці троє масивний служби перестають працювати на шість годин, але кілька інших веб-сайтів також припиняють роботу. Це також призвело до деяких жартівливих ласих уривків інформації, що надходили з Facebook, включаючи той факт, що в результаті кілька співробітників Facebook були випущені з офісів. Що саме сталося?

Розуміння протоколу Border Gateway Protocol (BGP)

Багато з цього спрощено та скорочено, щоб пояснити основні поняття того, що пішло не так у Facebook. Cloudflare має фантастичний технічний опис на всю ситуацію, якщо вам потрібен повністю поглиблений технічний аналіз разом із даними з їхнього власного DNS.

Щоразу, коли ви відвідуєте веб-сайт, зрозумілий для людини домен, який ви вводите, складається з літер і цифр, не насправді що безпосередньо з’єднує вас із веб-сайтом, який ви хочете відвідати. Натомість вони відображаються на IP-адресу, яку знаходить для вас сервер доменних імен. Більшим і важливішим за це є BGP, що означає Border Gateway Protocol. Цей механізм фактично діє як обмінник, який направляє інформацію між автономними системами через Інтернет. Фактично це основа широкого Інтернету, яка об’єднує все разом і за допомогою якої одна мережа може рекламувати своє існування іншим мережам.

Коли ми користуємося Інтернетом, ми взаємодіємо з тисячами інтернет-провайдерів, маршрутизаторів і серверів. Кожен веб-сайт, який ви відвідуєте, кожне підключення, яке маршрутизується у фоновому режимі, усі вони встановлюють зв’язок із кількома системами, які безпосередньо не пов’язані одна з одною. BGP ефективно показує вашому комп’ютеру, смартфону чи будь-якому іншому пристрою найкращий шлях до місця призначення. Частиною роботи BGP також є пошук найкращого шляху від вашого пристрою до місця призначення.

BGP з’єднує, зокрема, автономні системи, і ці автономні системи належать окремим організаціям і мають власну мережу. Це може бути постачальник послуг Інтернету, велика компанія або навіть університет. Я закінчив університетський коледж Дубліна минулого місяця, і він має власну автономну систему, яка була виділена в 1993 році. Інформація про ці системи є загальнодоступною.

Проблема в тому, що Інтернет є живою, дихаючою істотою. Ці мережі постійно оновлюються, і кожна автономна система спільно використовує власні мережі одна з одною весь час. Ця мережа потім будується різними автономними системами, які спілкуються одна з одною та створюють власну карту Інтернету. Відомо, коли уряд Пакистану намагався заборонити YouTube у 2008 році, він використовував BGP, щоб направити YouTube у чорну діру. Оскільки потім це було спільно з іншими автономними системами, які скопіювали цю конфігурацію, майже весь трафік YouTube було спрямовано до чорної діри в Пакистані. Сам YouTube був цілком нормальним, але зловживання маршрутизацією BGP фактично тимчасово вбило веб-сайт.

Роль Facebook

Ось проблема: Facebook керує власним набором серверів доменних імен. Вони відповідають за повідомлення вашого постачальника послуг Інтернету та всіх посередників у цьому маршрут, де насправді "facebook" (і всі інші продукти компанії, такі як Instagram і WhatsApp). є. Facebook припинив транслювати інформацію про маршрутизацію BGP на власні сервери доменних імен, які транслювали цю інформацію автономним системам по всьому світу. Це означало, що Facebook фактично відключився від Інтернету. Брайан Кребс, репортер з питань кібербезпеки, сказав, що це, схоже, було «звичайне оновлення BGP пішло не так».

У першій публікації Facebook було сказано наступне:

Наші інженерні групи дізналися, що зміни конфігурації на магістральних маршрутизаторах, які координують мережевий трафік між нашими центрами обробки даних, спричинили проблеми, які перервали цей зв’язок. Це порушення мережевого трафіку призвело до каскадного впливу на зв’язок наших центрів обробки даних, що призвело до припинення наших послуг.

Пізніше компанії більше поглиблена розбивка ситуації надав більше інформації.

Під час одного з цих планових робіт з технічного обслуговування була видана команда з наміром оцінити доступність глобальної магістралі пропускну здатність, яка ненавмисно перервала всі з’єднання в нашій магістральній мережі, фактично від’єднавши центри обробки даних Facebook глобально.

Потім Facebook пояснив, що коли їхні DNS-сервери не можуть спілкуватися з центрами обробки даних, вони відкликають свою рекламу BGP. Це те, що відрізало Facebook від решти світу і зробило його DNS повністю недоступним. Компанія також розповіла про те, що інженерам було важко приїхати на місце, щоб усунути проблему, що має сенс, оскільки в кількох звітах говорилося про те, як співробітники Facebook мали проблеми навіть із входом у свої офіси.

Глобальні розгалуження

Чудовий опис Cloudflare детально розповідає про деякі проблеми, які він помітив, а також про деякі наслідки в результаті припинення роботи Facebook. Cloudflare використовує власний DNS, 1.1.1.1, і постачальник побачив, що власний веб-сайт Facebook перестав виправлятися. Насправді вони хвилювалися, що це була проблема з їхніми системами. Facebook припинив передачу інформації про маршрутизацію на свій DNS, що означало, що його DNS був недоступний.

Коли Facebook припинив трансляцію маршрутів, DNS-розпізнувачі пішли з ладу. Між додатками, які намагаються постійно підключитися до Facebook, і поведінкою людей внаслідок спаму на сервери Facebook, «цунамі» додаткового трафіку DNS вразило Cloudflare серверів.

Досить смішно, деякі Власники пристроїв Huawei зазначили, що вони також більше не можуть підключатися до мереж Wi-Fi. Можливо, Huawei так чи інакше використовує сервери Facebook, щоб перевірити, чи активне підключення до Інтернету. Це також міг бути нещасливий збіг обставин.

Але все ще стає гірше. Коли Facebook припинив роботу, Cloudflare зазначив, що запити на інші платформи, такі як Twitter, Signal, Telegram і TikTok, зросли. Twitter також почав боротися під навантаженням, і на короткі кілька хвилин думали багато що воно теж знизиться.

Веб-сайти, які використовують систему єдиного входу з Facebook, також зіткнулися з проблемами, оскільки багато користувачів не могли навіть увійти. Увесь Інтернет у багатьох відношеннях зіткнувся з проблемами, скаржилися служби по всьому світу. Через кілька годин Facebook відновив роботу.

Якщо вся ця катастрофа доводить одну річ, то це як Єва Гальперін, директор із кібербезпеки Electronic Frontier Foundation каже: "Інтернет тримається за допомогою жувальної гумки та мотузки".