Защо прекъсването на Facebook затвори много служители от собствените им офиси

Прекъсването във Facebook затвори много служители от собствените им офиси, но как се случи това? Гмуркаме се дълбоко и обясняваме как.

Facebook, Instagram и WhatsApp всичко падна вчера. Вероятно сте чували за това, като се има предвид, че не само тези три масивна услугите се изключват офлайн за шест часа, но няколко други уебсайта също бяха свалени с това. Това също доведе до някои хумористични пикантни информации, излизащи от Facebook, включително факта, че множество служители на Facebook бяха изключени от офисите си в резултат на това. Какво точно се случи обаче?

Разбиране на Border Gateway Protocol (BGP)

Голяма част от това е опростено и съкратено, за да се обяснят основните концепции за това какво се е объркало във Facebook. Cloudflare има фантастично техническо описание върху цялата ситуация, ако искате напълно задълбочен технически анализ, пълен с данни от техния собствен DNS.

Всеки път, когато посетите уебсайт, четимият от хора домейн, който въвеждате, съставен от букви и цифри, не е

всъщност това, което директно ви свързва с уебсайта, който искате да посетите. Вместо това те картографират IP адрес, който сървърът за имена на домейни намира вместо вас. По-голям, по-важен от това е BGP, което означава Border Gateway Protocol. Този механизъм ефективно действа като обмен, който маршрутизира информация между автономни системи в интернет. Това всъщност е гръбнакът на по-широкия интернет, който го свързва заедно и е начинът, по който една мрежа може да рекламира съществуването си пред други мрежи.

Когато използваме интернет, ние взаимодействаме с хиляди доставчици на интернет услуги, рутери и сървъри. Всеки уебсайт, който посещавате, всяка връзка, която е маршрутизирана във фонов режим, всички те осъществяват контакт с няколко системи, които не са пряко свързани една с друга. BGP ефективно показва на вашия компютър, смартфон или друго устройство най-добрия начин да стигнете до вашата дестинация. Част от работата на BGP е също да намери най-добрия път от вашето устройство до вашата дестинация.

BGP свързва по-специално автономни системи и тези автономни системи са собственост на отделни субекти и имат собствена мрежа. Те могат да бъдат доставчик на интернет услуги, голяма компания или дори университет. Завърших университетския колеж в Дъблин миналия месец и той има своя собствена автономна система, която беше разпределена през 1993 г. Информацията за тези системи е публична.

Проблемът е, че интернет е живо, дишащо същество. Тези мрежи се актуализират непрекъснато и автономните системи споделят собствените си мрежи една с друга през цялото време. След това тази мрежа се изгражда от различни автономни системи, които говорят помежду си и създават своя собствена карта на интернет. известно, когато пакистанското правителство се опита да забрани YouTube през 2008 г, той използва BGP, за да насочи YouTube към черна дупка. Тъй като след това това беше споделено с други автономни системи, които копираха тази конфигурация, почти целият трафик на YouTube беше насочен към черна дупка в Пакистан. Самият YouTube беше напълно наред, но злоупотребата с BGP маршрутизация ефективно уби уебсайта временно.

Ролята на Facebook

Ето го проблемът: Facebook управлява свой собствен набор от сървъри за имена на домейни. Те са отговорни да уведомят вашия доставчик на интернет услуги и всички посредници в това маршрут, където всъщност "facebook" (и всички други продукти на компанията, като Instagram и WhatsApp). е. Facebook спря да излъчва информация за маршрутизиране на BGP към собствените си сървъри за имена на домейни, които излъчват тази информация към автономни системи по целия свят. Това означаваше, че Facebook ефективно се е изключил от интернет. Брайън Кребс, репортер по киберсигурност, каза, че това изглежда е "рутинна актуализация на BGP, която се е объркала".

В първоначалната публикация на Facebook се казва следното:

Нашите инженерни екипи са научили, че промените в конфигурацията на опорните рутери, които координират мрежовия трафик между нашите центрове за данни, са причинили проблеми, които са прекъснали тази комуникация. Това прекъсване на мрежовия трафик имаше каскаден ефект върху начина, по който нашите центрове за данни комуникират, спирайки услугите ни.

По-късно компанията е повече задълбочена разбивка на ситуацията предостави повече информация.

По време на една от тези задачи по рутинна поддръжка беше издадена команда с намерението да се оцени наличността на глобалната опорна мрежа капацитет, който неволно прекъсна всички връзки в нашата опорна мрежа, ефективно прекъсвайки връзката с центровете за данни на Facebook глобално.

След това Facebook продължи да обяснява, че когато техните DNS сървъри не могат да говорят с техните центрове за данни, те оттеглят своите BGP реклами. Това е, което откъсна Facebook от останалия свят и направи неговия DNS напълно недостъпен. Компанията също така говори за това как е било трудно за инженерите да стигнат на място, за да отстранят проблема, което има смисъл, тъй като множество доклади говореха за това как персоналът на Facebook е имал проблеми дори с влизането в своите офиси.

Глобални разклонения

Отличното описание на Cloudflare навлиза в подробности за някои от проблемите, които е забелязала, заедно с някои от разклоненията в резултат на спирането на Facebook. Cloudflare работи със собствен DNS, 1.1.1.1, и доставчикът видя, че собственият уебсайт на Facebook спря да разрешава. Всъщност те се притесняваха, че това е проблем с техните системи. Facebook беше спрял да излъчва информация за маршрутизиране към своя DNS, което означаваше, че неговият DNS беше недостъпен.

Когато Facebook спря да излъчва маршрути, DNS резолверите се объркаха. Между приложенията, които се опитват постоянно да се свързват отново с Facebook, и човешкото поведение също което води до спам към сървърите на Facebook, „цунами“ от допълнителен DNS трафик удари Cloudflare сървъри.

Колкото и да е смешно, някои Собственици на устройства Huawei отбелязаха, че вече не могат да се свързват и с Wi-Fi мрежи. Възможно е Huawei да използва сървърите на Facebook по някакъв или друг начин, за да провери дали интернет връзката е активна. Може също да е било нещастно съвпадение.

Все още става по-лошо. Когато Facebook се срина, Cloudflare отбеляза, че заявките за други платформи като Twitter, Signal, Telegram и TikTok се увеличиха. Twitter също започна да се бори под натоварването и за кратки няколко минути, мнозина си помислиха че и то ще падне.

Уебсайтовете, които използват единично влизане с Facebook, също се сблъскаха с проблеми, тъй като много потребители дори не можеха да влязат. Целият интернет по много начини се натъкна на проблеми, като услугите по целия свят се оплакваха. Няколко часа по-късно Facebook се върна онлайн.

Ако целият този провал доказва едно нещо, то е като Ева Галперин, директор по киберсигурността в Electronic Frontier Foundation казва: "интернет се държи заедно с дъвка и връв".