De ce întreruperea Facebook a exclus mulți angajați din propriile birouri

Întreruperea de la Facebook a exclus mulți angajați din propriile birouri, dar cum s-a întâmplat asta? Ne scufundăm adânc și explicăm cum.

Facebook, Instagram și WhatsApp toate s-au prăbușit ieri. Probabil ați auzit despre asta, având în vedere că nu numai cei trei au auzit masiv serviciile sunt luate offline timp de șase ore, dar și alte câteva site-uri web au fost eliminate cu ele. De asemenea, a dus la ieșirea unor informații pline de umor din Facebook, inclusiv faptul că mai mulți angajați Facebook au fost excluși din birourile lor ca urmare. Ce sa întâmplat mai exact, totuși?

Înțelegerea protocolului Border Gateway (BGP)

Multe dintre acestea sunt simplificate și reduse pentru a explica conceptele de bază despre ceea ce a mers prost la Facebook. Cloudflare are un articol tehnic fantastic asupra întregii situații dacă doriți o analiză tehnică complet aprofundată, completată cu date din propriul DNS.

Ori de câte ori vizitați un site web, domeniul care poate fi citit de om pe care îl introduceți format din litere și cifre nu este

de fapt ceea ce vă conectează direct la site-ul web pe care doriți să îl vizitați. În schimb, se mapează la o adresă IP pe care un server de nume de domeniu o găsește pentru tine. Mai mare, mai important decât atât este BGP, care înseamnă Border Gateway Protocol. Acest mecanism acționează efectiv ca un schimb care direcționează informații între sisteme autonome pe internet. Este efectiv coloana vertebrală a internetului mai larg care leagă pe toate și este modul în care o rețea își poate promova existența altor rețele.

Când folosim internetul, interacționăm cu mii de furnizori de servicii de internet, routere și servere. Fiecare site web pe care îl vizitați, fiecare conexiune care este direcționată în fundal, toate intră în contact cu mai multe sisteme care nu au nicio legătură între ele. BGP vă arată în mod eficient computerul sau smartphone-ul sau orice alt dispozitiv cel mai bun mod de a ajunge la destinație. O parte a sarcinii BGP este, de asemenea, să găsească cea mai bună cale de la dispozitiv la destinație.

BGP conectează sisteme autonome în special, iar aceste sisteme autonome sunt deținute de entități singulare și au propria lor rețea. Pot fi un furnizor de servicii de internet, o companie mare sau chiar o universitate. Am absolvit University College Dublin luna trecută și are propriul sistem autonom care a fost alocat în 1993. Informațiile despre aceste sisteme sunt publice.

Problema este că internetul este o ființă vie, care respiră. Aceste rețele se actualizează în mod constant, iar sistemele autonome își împărtășesc fiecare rețelele proprii tot timpul. Această rețea este apoi construită de diferite sisteme autonome care vorbesc între ele și își creează propria hartă a internetului. Faimos, când guvernul pakistanez a încercat să interzică YouTube în 2008, a folosit BGP pentru a direcționa YouTube într-o gaură neagră. Deoarece acest lucru a fost apoi partajat cu alte sisteme autonome care au copiat acea configurație, aproape tot traficul YouTube a fost direcționat către o gaură neagră din Pakistan. YouTube în sine a fost complet bine, dar abuzul de rutare BGP a ucis temporar site-ul web.

Facebook are rolul de jucat

Iată problema: Facebook operează propriul set de servere de nume de domeniu. Aceștia sunt responsabili pentru informarea furnizorului dvs. de servicii de internet și a tuturor intermediarilor ruta unde „facebook” (și toate celelalte produse ale companiei, cum ar fi Instagram și WhatsApp) de fapt este. Facebook a încetat să mai difuzeze informații de rutare BGP către propriile servere de nume de domeniu, care au difuzat aceste informații către sisteme autonome din întreaga lume. Acest lucru însemna că Facebook s-a deconectat efectiv de la internet. Brian Krebs, un reporter de securitate cibernetică, a spus că pare a fi o „actualizare BGP de rutină greșită”.

În autopsia inițială a Facebook, acesta a spus următoarele:

Echipele noastre de ingineri au aflat că modificările de configurare ale routerelor backbone care coordonează traficul de rețea între centrele noastre de date au cauzat probleme care au întrerupt această comunicare. Această întrerupere a traficului de rețea a avut un efect în cascadă asupra modului în care centrele noastre de date comunică, oprind serviciile noastre.

Mai târziu, compania este mai mult defalcare în profunzime a situației a oferit mai multe informații.

În timpul uneia dintre aceste lucrări de întreținere de rutină, a fost emisă o comandă cu intenția de a evalua disponibilitatea coloanei vertebrale globale. capacitatea, care a întrerupt în mod neintenționat toate conexiunile din rețeaua noastră principală, deconectând efectiv centrele de date Facebook la nivel global.

Facebook a continuat să explice că atunci când serverele lor DNS nu pot vorbi cu centrele lor de date, își retrag reclamele BGP. Acesta este ceea ce a separat Facebook de restul lumii și ceea ce a făcut ca DNS-ul său să fie complet inaccesibil. Compania a vorbit, de asemenea, despre cum a fost dificil pentru ingineri să ajungă la fața locului pentru a remedia problema, ceea ce are sens, deoarece mai multe rapoarte au vorbit despre modul în care personalul Facebook a avut probleme chiar la intrarea lor birouri.

ramificații globale

Scrisul excelent al lui Cloudflare intră în detaliu despre unele dintre problemele pe care le-a observat, împreună cu unele dintre ramificațiile ca urmare a căderii Facebook. Cloudflare operează propriul DNS, 1.1.1.1, iar furnizorul a văzut că site-ul propriu al Facebook a încetat să se mai rezolve. De fapt, s-au îngrijorat că era o problemă cu sistemele lor. Facebook a încetat să mai difuzeze informații de rutare către DNS-ul său, ceea ce înseamnă că DNS-ul său nu era disponibil.

Când Facebook a încetat să mai transmită rute, soluțiile DNS au luat-o peste cap. Între aplicațiile care încearcă să se reconecteze constant la Facebook și, de asemenea, comportamentul uman rezultând spam către serverele Facebook, un „tsunami” de trafic DNS suplimentar a lovit Cloudflare servere.

Destul de amuzant, unii Posesorii de dispozitive Huawei au remarcat că nici nu se mai pot conecta la rețelele Wi-Fi. Este posibil ca Huawei să folosească serverele Facebook într-un fel sau altul pentru a verifica dacă o conexiune la internet este activă. S-ar putea să fi fost și o coincidență nefericită.

Se înrăutățește totuși. Când Facebook a scăzut, Cloudflare a observat că interogările pentru alte platforme precum Twitter, Signal, Telegram și TikTok au crescut. Twitter a început să se lupte și sub sarcină și, pentru câteva minute, multi s-au gandit că ar coborî şi el.

Site-urile web care utilizează conectarea unică cu Facebook au întâmpinat și probleme, deoarece mulți utilizatori nici măcar nu s-au putut conecta. Întregul internet a întâmpinat probleme în multe privințe, servicii de pe tot globul plângându-se. Câteva ore mai târziu, Facebook a revenit online.

Dacă toată această dezamăgire dovedește un lucru, este ca Eva Galperin, director de securitate cibernetică la Electronic Frontier Foundation spune: „internetul este ținut împreună cu gumă și sfoară”.