Prečo výpadok Facebooku zatvoril mnohých zamestnancov z ich vlastných kancelárií

Výpadok na Facebooku vylúčil mnohých zamestnancov z ich vlastných kancelárií, ale ako sa to stalo? Ponoríme sa hlboko a vysvetlíme ako.

Facebook, Instagram a WhatsApp všetko padlo včera. Pravdepodobne ste o tom počuli, keďže nielen títo traja masívne služby sa prevezmú do režimu offline na šesť hodín, ale spolu s nimi sa odstráni aj niekoľko ďalších webových stránok. Viedlo to aj k niektorým vtipným kúskom informácií, ktoré vychádzajú z Facebooku, vrátane skutočnosti, že viacerí zamestnanci Facebooku boli v dôsledku toho zatvorení zo svojich kancelárií. Čo sa však presne stalo?

Pochopenie protokolu Border Gateway Protocol (BGP)

Veľa z toho je zjednodušených a zredukovaných, aby sa vysvetlili základné pojmy toho, čo sa na Facebooku pokazilo. Cloudflare má fantastický technický popis na celú situáciu, ak chcete úplne hĺbkovú technickú analýzu s údajmi z vlastného DNS.

Kedykoľvek navštívite webovú stránku, ľudsky čitateľná doména, ktorú zadávate, zložená z písmen a číslic nie je vlastne čo vás priamo spája s webovou stránkou, ktorú chcete navštíviť. Namiesto toho sa mapujú na adresu IP, ktorú vám server názvov domén nájde. Väčší a dôležitejší je BGP, čo je skratka pre Border Gateway Protocol. Tento mechanizmus efektívne funguje ako výmena, ktorá smeruje informácie medzi autonómnymi systémami cez internet. Je to vlastne chrbtica širšieho internetu, ktorá to všetko spája a je to spôsob, akým môže jedna sieť propagovať svoju existenciu iným sieťam.

Keď používame internet, komunikujeme s tisíckami poskytovateľov internetových služieb, smerovačov a serverov. Každá webová stránka, ktorú navštívite, každé spojenie, ktoré je smerované na pozadí, všetky nadväzujú kontakt s niekoľkými systémami, ktoré spolu priamo nesúvisia. BGP efektívne ukáže vášmu počítaču alebo smartfónu alebo akémukoľvek inému zariadeniu najlepší spôsob, ako sa dostať do cieľa. Súčasťou práce BGP je tiež nájsť najlepšiu cestu z vášho zariadenia do cieľa.

BGP spája najmä autonómne systémy, pričom tieto autonómne systémy sú vo vlastníctve jednotlivých subjektov a majú svoju vlastnú sieť. Môžu to byť poskytovateľ internetových služieb, veľká spoločnosť alebo dokonca univerzita. Minulý mesiac som absolvoval University College v Dubline a má svoj vlastný autonómny systém, ktorý bol pridelený v roku 1993. Informácie o týchto systémoch sú verejné.

Problém je, že internet je živá, dýchajúca bytosť. Tieto siete sa neustále aktualizujú a autonómne systémy navzájom zdieľajú svoje vlastné siete celý čas. Túto sieť potom vytvárajú rôzne autonómne systémy, ktoré spolu hovoria a vytvárajú si vlastnú mapu internetu. famózne, keď sa pakistanská vláda v roku 2008 pokúsila zakázať YouTube, použila BGP na nasmerovanie YouTube do čiernej diery. Pretože to bolo potom zdieľané s inými autonómnymi systémami, ktoré túto konfiguráciu skopírovali, takmer všetka prevádzka YouTube bola nasmerovaná do čiernej diery v Pakistane. Samotný YouTube bol úplne v poriadku, ale zneužívanie smerovania BGP web dočasne zabilo.

Úlohu Facebooku

Tu je problém: Facebook prevádzkuje vlastnú sadu serverov doménových mien. Títo sú zodpovední za informovanie vášho poskytovateľa internetových služieb a všetkých sprostredkovateľov trasa, kde vlastne „facebook“ (a všetky ostatné produkty spoločnosti, ako sú Instagram a WhatsApp). je. Facebook prestal vysielať informácie o smerovaní BGP na svoje vlastné servery doménových mien, ktoré tieto informácie vysielajú do autonómnych systémov po celom svete. To znamenalo, že Facebook sa efektívne odpojil od internetu. Brian Krebs, reportér kybernetickej bezpečnosti, uviedol, že sa zdá, že ide o „bežnú aktualizáciu BGP, ktorá sa pokazila“.

V prvom post mortem na Facebooku sa uvádzalo nasledovné:

Naše inžinierske tímy zistili, že zmeny konfigurácie na chrbticových smerovačoch, ktoré koordinujú sieťovú prevádzku medzi našimi dátovými centrami, spôsobili problémy, ktoré prerušili túto komunikáciu. Toto prerušenie sieťovej prevádzky malo kaskádový vplyv na spôsob, akým naše dátové centrá komunikujú, čím sa naše služby zastavili.

Neskôr spoločnosť viac hĺbkové členenie o situácii poskytol viac informácií.

Počas jednej z týchto úloh bežnej údržby bol vydaný príkaz s úmyslom posúdiť dostupnosť globálnej chrbtice kapacita, ktorá neúmyselne prerušila všetky pripojenia v našej chrbticovej sieti, čím sa fakticky odpojili dátové centrá Facebooku globálne.

Facebook potom vysvetlil, že keď ich servery DNS nemôžu komunikovať s ich dátovými centrami, stiahnu svoje reklamy BGP. To je to, čo odrezalo Facebook od zvyšku sveta a vďaka čomu bol jeho DNS úplne nedostupný. Spoločnosť tiež hovorila o tom, ako bolo pre inžinierov ťažké dostať sa na miesto, aby problém vyriešili, čo dáva zmysel, keďže viaceré správy hovorili o tom, ako mali zamestnanci Facebooku problémy aj so vstupom do svojich úradov.

Globálne dôsledky

Vynikajúci popis Cloudflare podrobne popisuje niektoré problémy, ktoré si všimol, spolu s niektorými dôsledkami v dôsledku pádu Facebooku. Cloudflare prevádzkuje svoj vlastný DNS, 1.1.1.1, a poskytovateľ videl, že vlastný web Facebooku prestal riešiť. V skutočnosti sa obávali, že ide o problém s ich systémami. Facebook prestal vysielať informácie o smerovaní do svojho DNS, čo znamená, že jeho DNS bol nedostupný.

Keď Facebook prestal vysielať trasy, DNS resolvery zlyhali. Medzi aplikáciami, ktoré sa neustále pokúšajú pripojiť k Facebooku, a ľudským správaním čo malo za následok spam na servery Facebooku, „tsunami“ dodatočného prenosu DNS zasiahlo Cloudflare serverov.

Je smiešne, niektoré Majitelia zariadení Huawei poznamenali, že sa už nemohli pripojiť ani k sieťam Wi-Fi. Je možné, že Huawei nejakým spôsobom používa servery Facebooku na overenie, či je internetové pripojenie aktívne. Mohla to byť aj nešťastná náhoda.

Stále sa to však zhoršuje. Keď Facebook klesol, Cloudflare poznamenal, že dopyty na iné platformy ako Twitter, Signal, Telegram a TikTok vzrástli. Twitter sa začal trápiť aj pod záťažou a na krátkych pár minút, mnohí si mysleli že by to šlo aj dole.

Problémy mali aj webové stránky, ktoré používajú jednotné prihlásenie s Facebookom, keďže mnohí používatelia sa nevedeli ani prihlásiť. Celý internet v mnohých ohľadoch narazil na problémy a služby po celom svete sa sťažovali. O niekoľko hodín neskôr bol Facebook opäť online.

Ak celý tento debakel dokazuje jednu vec, je to Eva Galperin, riaditeľka kybernetickej bezpečnosti v Electronic Frontier Foundation hovorí: "internet drží pohromade žuvačkou a šnúrkou".