Mengapa pemadaman Facebook membuat banyak karyawan tidak bisa bekerja di kantor mereka sendiri

Pemadaman di Facebook membuat banyak karyawan tidak bisa bekerja di kantor mereka, tapi bagaimana hal itu bisa terjadi? Kami menyelami lebih dalam dan menjelaskan caranya.

Facebook, Instagram, dan WhatsApp semuanya turun kemarin. Anda mungkin pernah mendengarnya, mengingat tidak hanya ketiganya saja besar sekali layanan menjadi offline selama enam jam, tetapi beberapa situs web lain juga ditutup. Hal ini juga menimbulkan beberapa informasi lucu yang keluar dari Facebook, termasuk fakta bahwa banyak karyawan Facebook dilarang masuk ke kantor mereka sebagai akibatnya. Namun, apa yang sebenarnya terjadi?

Memahami Protokol Gerbang Perbatasan (BGP)

Banyak hal yang disederhanakan dan dikurangi untuk menjelaskan konsep dasar tentang apa yang salah di Facebook. Cloudflare punya artikel teknis yang luar biasa pada keseluruhan situasi jika Anda ingin analisis teknis yang benar-benar mendalam lengkap dengan data dari DNS mereka sendiri.

Setiap kali Anda mengunjungi situs web, domain yang dapat dibaca manusia yang Anda ketikkan terdiri dari huruf dan angka tidak

Sebenarnya apa yang secara langsung menghubungkan Anda ke situs web yang ingin Anda kunjungi. Sebaliknya, mereka memetakan ke alamat IP yang ditemukan oleh Server Nama Domain untuk Anda. Lebih besar, lebih penting dari itu adalah BGP, yang merupakan singkatan dari Border Gateway Protocol. Mekanisme ini secara efektif bertindak sebagai pertukaran yang mengarahkan informasi antar sistem otonom melalui internet. Ini secara efektif merupakan tulang punggung internet yang lebih luas yang mengikat semuanya dan merupakan cara satu jaringan dapat mengiklankan keberadaannya ke jaringan lain.

Saat kita menggunakan internet, kita berinteraksi dengan ribuan penyedia layanan internet, router, dan server. Setiap situs web yang Anda kunjungi, setiap koneksi yang dirutekan di latar belakang, semuanya melakukan kontak dengan beberapa sistem yang semuanya tidak berhubungan langsung satu sama lain. BGP secara efektif menunjukkan komputer atau ponsel cerdas Anda atau perangkat lain apa pun cara terbaik untuk mencapai tujuan Anda. Bagian dari tugas BGP juga adalah menemukan jalur terbaik dari perangkat Anda ke tujuan Anda.

BGP khususnya menghubungkan sistem otonom, dan sistem otonom ini dimiliki oleh entitas tunggal dan memiliki jaringannya sendiri. Mereka bisa menjadi penyedia layanan internet, perusahaan besar, atau bahkan universitas. Saya lulus dari University College Dublin bulan lalu, dan universitas tersebut memiliki sistem otonomnya sendiri yang dialokasikan pada tahun 1993. Informasi mengenai sistem ini bersifat publik.

Masalahnya, internet adalah makhluk yang hidup dan bernafas. Jaringan-jaringan ini diperbarui terus-menerus, dan sistem otonom masing-masing berbagi jaringannya satu sama lain sepanjang waktu. Jaringan ini kemudian dibangun oleh sistem otonom berbeda yang berkomunikasi satu sama lain dan membuat peta internet mereka sendiri. Yang terkenal, ketika pemerintah Pakistan berusaha melarang YouTube pada tahun 2008, ia menggunakan BGP untuk mengarahkan YouTube ke lubang hitam. Karena konfigurasi ini kemudian dibagikan dengan sistem otonom lain yang meniru konfigurasi tersebut, hampir semua lalu lintas YouTube dialihkan ke lubang hitam di Pakistan. YouTube sendiri baik-baik saja, tetapi penyalahgunaan perutean BGP secara efektif mematikan situs web untuk sementara.

Bagian Facebook yang harus dimainkan

Inilah masalahnya: Facebook mengoperasikan Server Nama Domainnya sendiri. Ini bertanggung jawab untuk memberi tahu penyedia layanan internet Anda dan semua perantara di dalamnya rute ke mana "facebook" (dan semua produk perusahaan lainnya, seperti Instagram dan WhatsApp) sebenarnya adalah. Facebook berhenti menyiarkan informasi perutean BGP ke server nama domainnya sendiri, yang menyiarkan informasi tersebut ke sistem otonom di seluruh dunia. Ini berarti Facebook telah secara efektif memutus koneksinya dari internet. Brian Krebs, seorang reporter keamanan siber, mengatakan bahwa tampaknya ini adalah "pembaruan BGP rutin yang tidak beres".

Dalam post mortem awal Facebook, tertulis sebagai berikut:

Tim teknik kami telah mengetahui bahwa perubahan konfigurasi pada router tulang punggung yang mengoordinasikan lalu lintas jaringan antara pusat data kami menyebabkan masalah yang mengganggu komunikasi ini. Gangguan pada lalu lintas jaringan ini berdampak pada cara pusat data kami berkomunikasi, sehingga layanan kami terhenti.

Nanti, perusahaannya lebih banyak lagi pemecahan yang mendalam situasi memberikan informasi lebih lanjut.

Dalam salah satu pekerjaan pemeliharaan rutin ini, sebuah perintah dikeluarkan dengan tujuan untuk menilai ketersediaan tulang punggung global kapasitas, yang secara tidak sengaja memutus semua koneksi di jaringan tulang punggung kami, sehingga secara efektif memutus pusat data Facebook secara global.

Facebook kemudian menjelaskan bahwa ketika server DNS mereka tidak dapat terhubung ke pusat data mereka, mereka menarik iklan BGP mereka. Inilah yang memisahkan Facebook dari seluruh dunia, dan yang membuat DNS-nya sama sekali tidak dapat dijangkau. Perusahaan juga berbicara tentang betapa sulitnya para insinyur datang ke lokasi untuk memperbaiki masalah tersebut. Hal ini masuk akal, karena banyak laporan berbicara tentang bagaimana staf Facebook mengalami masalah bahkan saat memasuki akun mereka kantor.

Konsekuensi global

Tulisan Cloudflare yang sangat bagus menjelaskan secara rinci tentang beberapa masalah yang ditemukan, bersama dengan beberapa konsekuensi akibat jatuhnya Facebook. Cloudflare mengoperasikan DNS-nya sendiri, 1.1.1.1, dan penyedia melihat bahwa situs web Facebook sendiri berhenti menyelesaikan masalah. Faktanya, mereka khawatir hal itu merupakan masalah pada sistem mereka. Facebook telah berhenti menyiarkan informasi perutean ke DNS-nya, yang berarti DNS-nya tidak tersedia.

Ketika Facebook berhenti menyiarkan rute, penyelesai DNS menjadi rusak. Antara aplikasi yang mencoba untuk terus terhubung kembali ke Facebook, dan juga perilaku manusia mengakibatkan spam ke server Facebook, "tsunami" lalu lintas DNS tambahan menghantam Cloudflare server.

Lucunya, beberapa Pemilik perangkat Huawei mencatat bahwa mereka juga tidak dapat lagi terhubung ke jaringan Wi-Fi. Ada kemungkinan Huawei menggunakan server Facebook dengan cara tertentu untuk memverifikasi apakah koneksi internet aktif. Ini mungkin juga merupakan suatu kebetulan yang tidak menguntungkan.

Namun tetap saja keadaannya menjadi lebih buruk. Ketika Facebook down, Cloudflare mencatat bahwa permintaan untuk platform lain seperti Twitter, Signal, Telegram, dan TikTok meningkat. Twitter juga mulai kesulitan karena beban tersebut, dan selama beberapa menit, banyak yang berpikir bahwa itu akan turun juga.

Situs web yang menggunakan sistem masuk tunggal dengan Facebook juga mengalami masalah, karena banyak pengguna bahkan tidak bisa masuk. Seluruh internet dalam banyak hal mengalami masalah, dan banyak layanan di seluruh dunia yang mengeluh. Beberapa jam kemudian, Facebook kembali online.

Jika seluruh bencana ini membuktikan satu hal, maka itu adalah seperti yang dikatakan Eva Galperin, direktur keamanan siber di Electronic Frontier Foundation. mengatakan: "internet disatukan dengan permen karet dan tali".