Miks Facebooki katkestus sulges paljud töötajad oma kontoritest

Facebooki katkestus sulges paljud töötajad oma kontoritest, kuid kuidas see juhtus? Sukeldume sügavale ja selgitame, kuidas.

Facebook, Instagram ja WhatsApp kõik läks eile alla. Tõenäoliselt kuulsite sellest, arvestades, et mitte ainult need kolm massiivne teenused võetakse kuueks tunniks võrguühenduseta, kuid sellega eemaldati ka mõned muud veebisaidid. See tõi kaasa ka naljakaid näpunäiteid Facebookist, sealhulgas asjaolu, et mitmed Facebooki töötajad suleti seetõttu oma kontorist välja. Mis aga täpselt juhtus?

Border Gateway Protocol (BGP) mõistmine

Suur osa sellest on lihtsustatud ja kärbitud, et selgitada põhimõisteid selle kohta, mis Facebookis valesti läks. Cloudflare'il on fantastiline tehniline kirjeldus kogu olukorra kohta, kui soovite täiesti põhjalikku tehnilist analüüsi koos nende enda DNS-i andmetega.

Iga kord, kui külastate veebisaiti, ei ole inimloetav domeen, mille sisestate tähtedest ja numbritest tegelikult mis seob teid otseselt veebisaidiga, mida soovite külastada. Selle asemel kaardistavad nad IP-aadressi, mille domeeninimeserver teie jaoks leiab. Sellest suurem, olulisem on BGP, mis tähistab piirivärava protokolli. See mehhanism toimib tõhusalt teabevahetusena, mis suunab teavet autonoomsete süsteemide vahel üle Interneti. See on tegelikult laiema Interneti selgroog, mis seob selle kõik kokku ja see on see, kuidas üks võrk saab oma olemasolu teistele võrkudele reklaamida.

Internetti kasutades suhtleme tuhandete Interneti-teenuse pakkujate, ruuterite ja serveritega. Iga külastatav veebisait, iga taustal suunatav ühendus loob kontakti mitme süsteemiga, mis kõik pole üksteisega otseselt seotud. BGP näitab tõhusalt teie arvutile, nutitelefonile või muule seadmele parimat viisi sihtkohta jõudmiseks. Üks osa BGP tööst on ka leida parim tee teie seadmest sihtkohta.

BGP ühendab eelkõige autonoomseid süsteeme ja need autonoomsed süsteemid kuuluvad üksikutele üksustele ja neil on oma võrk. Need võivad olla Interneti-teenuse pakkuja, suur ettevõte või isegi ülikool. Lõpetasin eelmisel kuul Dublini ülikooli kolledži ja sellel on oma autonoomne süsteem, mis eraldati 1993. aastal. Teave nende süsteemide kohta on avalik.

Probleem on selles, et Internet on elav, hingav olend. Neid võrke uuendatakse pidevalt ja autonoomsed süsteemid jagavad üksteisega oma võrke kogu aeg. Seejärel loovad selle võrgu erinevad autonoomsed süsteemid, mis räägivad üksteisega ja loovad oma Interneti-kaardi. Kuulsalt, kui Pakistani valitsus üritas 2008. aastal YouTube'i keelata, kasutas see YouTube'i musta auku suunamiseks BGP-d. Kuna seda jagati seejärel teiste autonoomsete süsteemidega, mis seda konfiguratsiooni kopeerisid, suunati peaaegu kogu YouTube'i liiklus Pakistani musta auku. YouTube ise oli täiesti korras, kuid BGP-marsruutimise kuritarvitamine tappis veebisaidi ajutiselt.

Facebooki osa

Siin on probleem: Facebook haldab oma domeeninimeserverite komplekti. Nad vastutavad teie Interneti-teenuse pakkuja ja kõigi vahendajate teavitamise eest marsruut, kus "facebook" (ja kõik ettevõtte muud tooted, nagu Instagram ja WhatsApp) tegelikult on. Facebook lõpetas BGP marsruutimisteabe edastamise oma domeeninimeserveritele, mis edastavad seda teavet autonoomsetele süsteemidele kogu maailmas. See tähendas, et Facebook oli end Internetist tõhusalt lahti ühendanud. Küberjulgeoleku reporter Brian Krebs ütles, et see näib olevat "rutiinne BGP-värskendus, mis läks valesti".

Facebooki esialgses post mortem ütles see järgmist:

Meie insenerimeeskonnad on teada saanud, et meie andmekeskuste vahelist võrguliiklust koordineerivate magistraalruuterite konfiguratsioonimuudatused põhjustasid probleeme, mis selle suhtluse katkestasid. See võrguliikluse häire mõjutas meie andmekeskuste suhtlemist järk-järgult, peatades meie teenused.

Hiljem on ettevõte rohkem põhjalik jaotus andis rohkem teavet.

Ühel neist rutiinsetest hooldustöödest anti käsk, mille eesmärk oli hinnata ülemaailmse magistraalvõrgu kättesaadavust võimsus, mis tahtmatult katkestas kõik meie magistraalvõrgu ühendused, katkestades tõhusalt Facebooki andmekeskused globaalselt.

Seejärel selgitas Facebook, et kui nende DNS-serverid ei saa andmekeskustega suhelda, võtavad nad oma BGP-reklaamid tagasi. See lõikas Facebooki muust maailmast ära ja muutis selle DNS-i täiesti kättesaamatuks. Ettevõte rääkis ka sellest, kuidas inseneridel oli keeruline probleemi lahendamiseks kohapeale pääseda, mis on mõistlik, kuna mitmes aruandes räägiti sellest, kuidas Facebooki töötajatel oli probleeme isegi oma konto sisestamisega kontorid.

Globaalsed tagajärjed

Cloudflare'i suurepärane kirjeldus käsitleb üksikasjalikult mõningaid probleeme, mida ta märkas, ja mõningaid tagajärgi, mis tulenevad Facebooki langusest. Cloudflare haldab oma DNS-i 1.1.1.1 ja teenusepakkuja nägi, et Facebooki enda veebisait lakkas lahenduse leidmisest. Tegelikult olid nad mures, et see on nende süsteemidega seotud probleem. Facebook oli lõpetanud marsruutimisteabe edastamise oma DNS-ile, mis tähendab, et selle DNS ei olnud saadaval.

Kui Facebook lõpetas marsruutide edastamise, läksid DNS-i lahendajad sassi. Rakenduste vahel, mis üritavad pidevalt Facebookiga uuesti ühendust saada, ja ka inimeste käitumise vahel mille tulemuseks oli rämpspost Facebooki serverite suunas, tabas Cloudflare'i täiendava DNS-liikluse "tsunami" serverid.

Naljakas, mõned Huawei seadmete omanikud märkis, et nad ei saa enam ka WiFi-võrkudega ühendust luua. Võimalik, et Huawei kasutab ühel või teisel viisil Facebooki servereid, et kontrollida, kas Interneti-ühendus on aktiivne. See võis olla ka kahetsusväärne kokkusattumus.

See läheb siiski hullemaks. Kui Facebook langes, märkis Cloudflare, et teiste platvormide, nagu Twitter, Signal, Telegram ja TikTok, päringud kasvasid. Ka Twitter hakkas koormuse all vaeva nägema ja mõneks minutiks arvasid paljud et see ka alla läheks.

Ka Facebookiga ühekordset sisselogimist kasutavatel veebisaitidel tekkis probleeme, kuna paljud kasutajad ei saanud isegi sisse logida. Kogu Internet sattus mitmel viisil probleemidesse ja teenused kogu maailmas kaebasid. Paar tundi hiljem tuli Facebook uuesti võrku.

Kui kogu see kokkuvarisemine üht asja tõestab, siis Eva Galperin, Electronic Frontier Foundationi küberjulgeoleku direktor ütleb: "Internetti hoitakse koos närimiskummi ja nööriga".