Zakaj je izpad Facebooka mnogim zaposlenim onemogočil dostop do lastnih pisarn

Izpad na Facebooku je mnogim zaposlenim onemogočil dostop do njihovih pisarn, toda kako se je to zgodilo? Potopimo se globoko in razložimo, kako.

Facebook, Instagram in WhatsApp včeraj je šlo vse dol. Verjetno ste slišali za to, glede na to, da niso samo ti trije zelo veliko storitve za šest ur ostanejo brez povezave, vendar je bilo s tem ustavljenih tudi nekaj drugih spletnih mest. To je privedlo tudi do nekaterih šaljivih informacij, ki prihajajo iz Facebooka, vključno z dejstvom, da je bilo zaradi tega več zaposlenih na Facebooku zaprtih iz svojih pisarn. Kaj točno se je zgodilo?

Razumevanje protokola Border Gateway Protocol (BGP)

Veliko tega je poenostavljenega in okrnjenega, da bi razložili osnovne pojme o tem, kaj je šlo narobe pri Facebooku. Cloudflare ima fantastičen tehnični zapis o celotni situaciji, če želite popolnoma poglobljeno tehnično analizo skupaj s podatki iz njihovega lastnega DNS.

Kadar koli obiščete spletno mesto, človeku berljiva domena, ki jo vnesete, sestavljena iz črk in številk, ni

pravzaprav kar vas neposredno povezuje s spletnim mestom, ki ga želite obiskati. Namesto tega se preslikajo v naslov IP, ki ga namesto vas najde strežnik domenskih imen. Večji in pomembnejši od tega je BGP, kar pomeni Border Gateway Protocol. Ta mehanizem dejansko deluje kot izmenjava, ki usmerja informacije med avtonomnimi sistemi po internetu. Pravzaprav je hrbtenica širšega interneta, ki vse povezuje in je način, na katerega lahko eno omrežje oglašuje svoj obstoj drugim omrežjem.

Ko uporabljamo internet, komuniciramo s tisoči ponudnikov internetnih storitev, usmerjevalnikov in strežnikov. Vsako spletno mesto, ki ga obiščete, vsaka povezava, ki je usmerjena v ozadju, vsi vzpostavijo stik z več sistemi, ki med seboj niso neposredno povezani. BGP vašemu računalniku, pametnemu telefonu ali kateri koli drugi napravi učinkovito pokaže najboljši način, kako priti do cilja. Del naloge BGP je tudi iskanje najboljše poti od vaše naprave do cilja.

BGP povezuje zlasti avtonomne sisteme, ti avtonomni sistemi pa so v lasti posameznih subjektov in imajo svoje omrežje. Lahko so ponudnik internetnih storitev, veliko podjetje ali celo univerza. Prejšnji mesec sem diplomiral na University College Dublin in ima svoj avtonomni sistem, ki je bil dodeljen leta 1993. Podatki o teh sistemih so javni.

Težava je v tem, da je internet živo, dihajoče bitje. Ta omrežja se nenehno posodabljajo in avtonomni sistemi si med seboj delijo lastna omrežja ves čas. To omrežje nato zgradijo različni avtonomni sistemi, ki govorijo drug z drugim in ustvarjajo svoj zemljevid interneta. Znano, ko je pakistanska vlada leta 2008 poskušala prepovedati YouTube, je uporabil BGP, da je YouTube usmeril v črno luknjo. Ker je bilo to nato deljeno z drugimi avtonomnimi sistemi, ki so kopirali to konfiguracijo, je bil skoraj ves YouTubov promet preusmerjen v črno luknjo v Pakistanu. YouTube sam je bil povsem v redu, vendar je zloraba usmerjanja BGP začasno uničila spletno mesto.

Facebookova vloga

Tukaj je težava: Facebook upravlja svoj niz strežnikov domenskih imen. Ti so odgovorni za obveščanje vašega ponudnika internetnih storitev in vseh posrednikov pri tem poti, kjer dejansko "facebook" (in vsi drugi izdelki podjetja, kot sta Instagram in WhatsApp). je. Facebook je prenehal oddajati informacije o usmerjanju BGP svojim lastnim strežnikom domenskih imen, ki so te informacije oddajali avtonomnim sistemom po vsem svetu. To je pomenilo, da se je Facebook dejansko odklopil od interneta. Brian Krebs, poročevalec o kibernetski varnosti, je dejal, da se zdi, da gre za "rutinsko posodobitev BGP, ki je šla narobe".

V prvi Facebookovi objavi ob smrti je pisalo naslednje:

Naše inženirske ekipe so ugotovile, da so spremembe konfiguracije na hrbteničnih usmerjevalnikih, ki usklajujejo omrežni promet med našimi podatkovnimi centri, povzročile težave, ki so prekinile to komunikacijo. Ta motnja v omrežnem prometu je imela kaskadni učinek na način komunikacije naših podatkovnih centrov, zaradi česar so se naše storitve ustavile.

Kasneje je podjetje več poglobljena razčlenitev razmer posredoval več informacij.

Med enim od teh rutinskih vzdrževalnih del je bil izdan ukaz z namenom oceniti razpoložljivost globalne hrbtenice zmogljivosti, ki je nenamerno prekinil vse povezave v našem hrbteničnem omrežju, s čimer je dejansko prekinil povezavo med Facebookovimi podatkovnimi centri globalno.

Facebook je nato pojasnil, da ko njihovi strežniki DNS ne morejo komunicirati z njihovimi podatkovnimi centri, umaknejo svoje oglase BGP. To je tisto, kar je Facebook odrezalo od preostalega sveta in zaradi česar je bil njegov DNS popolnoma nedosegljiv. Podjetje je govorilo tudi o tem, kako je bilo inženirjem težko priti na kraj, da bi odpravili težavo, kar je smiselno, saj je več poročil govorilo o tem, kako je imelo osebje Facebooka težave celo pri vnosu svojih pisarne.

Globalne posledice

Cloudflare je v odličnem zapisu podrobno opisal nekatere težave, ki jih je opazil, skupaj z nekaterimi posledicami propada Facebooka. Cloudflare upravlja svoj lasten DNS, 1.1.1.1, in ponudnik je opazil, da se Facebookovo lastno spletno mesto neha razreševati. Pravzaprav jih je skrbelo, da gre za težave z njihovimi sistemi. Facebook je prenehal oddajati podatke o usmerjanju v svoj DNS, kar pomeni, da njegov DNS ni bil na voljo.

Ko je Facebook prenehal z oddajanjem poti, so razreševalci DNS zašli. Med aplikacijami, ki se nenehno poskušajo znova povezati s Facebookom, in tudi človeškim vedenjem posledica neželene pošte proti Facebookovim strežnikom, "cunami" dodatnega prometa DNS je prizadel Cloudflare strežniki.

Smešno, nekateri Lastniki naprav Huawei ugotovili, da se tudi ne morejo več povezati z omrežji Wi-Fi. Možno je, da Huawei tako ali drugače uporablja Facebookove strežnike za preverjanje, ali je internetna povezava aktivna. Morda je šlo tudi za nesrečno naključje.

Še vedno pa postaja slabše. Ko je Facebook propadel, je Cloudflare opazil, da so se poizvedbe za druge platforme, kot so Twitter, Signal, Telegram in TikTok, povečale. Tudi Twitter se je začel boriti pod obremenitvijo in za nekaj kratkih minut mnogi mislili da bi šlo tudi dol.

Težave so imele tudi spletne strani, ki uporabljajo enotno prijavo s Facebookom, saj se veliko uporabnikov ni moglo niti prijaviti. Celoten internet je na več načinov naletel na težave, storitve po vsem svetu so se pritoževale. Nekaj ​​ur kasneje se je Facebook vrnil na splet.

Če ta celoten debakel dokazuje eno stvar, je to kot Eva Galperin, direktorica kibernetske varnosti pri Electronic Frontier Foundation pravi: "internet držita skupaj žvečilni gumi in vrvica".