Facebook의 서비스 중단으로 인해 많은 직원이 사무실을 떠나는 이유

Facebook의 정전으로 인해 많은 직원이 사무실을 떠날 수 없게 되었습니다. 그런데 어떻게 그런 일이 일어났습니까? 우리는 깊이 파고들어 그 방법을 설명합니다.

페이스북, 인스타그램, 왓츠앱 어제 다 내려갔어. 그 세 사람뿐만 아니라 엄청난 서비스는 6시간 동안 오프라인 상태가 되지만, 다른 몇몇 웹사이트도 함께 다운되었습니다. 또한 결과적으로 여러 Facebook 직원이 사무실에서 퇴출당했다는 사실을 포함하여 Facebook에서 나오는 유머러스한 정보로 이어졌습니다. 그런데 정확히 무슨 일이 일어났나요?

BGP(Border Gateway Protocol) 이해

Facebook에서 무엇이 잘못되었는지에 대한 기본 개념을 설명하기 위해 많은 내용을 단순화하고 줄였습니다. Cloudflare는 환상적인 기술 문서 자체 DNS의 데이터를 사용하여 완전히 심층적인 기술 분석을 원하는 경우 전체 상황에 대해 설명합니다.

웹사이트를 방문할 때마다 문자와 숫자로 구성된 사람이 읽을 수 있는 도메인은 실제로 당신이 방문하고 싶은 웹사이트로 당신을 직접 연결시켜주는 것. 대신 도메인 이름 서버가 찾아주는 IP 주소에 매핑됩니다. 그보다 더 크고 중요한 것은 BGP(Border Gateway Protocol)입니다. 이 메커니즘은 인터넷을 통해 자율 시스템 간에 정보를 라우팅하는 교환 역할을 효과적으로 수행합니다. 이는 사실상 모든 것을 하나로 묶는 더 넓은 인터넷의 백본이며 한 네트워크가 자신의 존재를 다른 네트워크에 알릴 수 있는 방법입니다.

우리는 인터넷을 사용할 때 수천 개의 인터넷 서비스 제공업체, 라우터 및 서버와 상호 작용합니다. 귀하가 방문하는 모든 웹사이트, 백그라운드에서 라우팅되는 모든 연결은 모두 서로 직접적으로 관련되지 않은 여러 시스템과 연결됩니다. BGP는 컴퓨터, 스마트폰 또는 기타 장치에 목적지까지 가는 가장 좋은 방법을 효과적으로 보여줍니다. BGP의 임무 중 하나는 장치에서 목적지까지의 최적 경로를 찾는 것입니다.

BGP는 특히 자율 시스템을 연결하며, 이러한 자율 시스템은 단일 개체가 소유하고 자체 네트워크를 갖습니다. 인터넷 서비스 제공업체일 수도 있고, 대기업이나 대학일 수도 있습니다. 저는 지난 달 유니버시티 칼리지 더블린(University College Dublin)을 졸업했는데, 이 대학에는 1993년에 할당된 자체 자율 시스템이 있습니다.

이 시스템에 대한 정보는 공개되어 있습니다.

문제는 인터넷이 살아 숨쉬는 존재라는 점이다. 이러한 네트워크는 지속적으로 업데이트되며 자율 시스템은 각각 자체 네트워크를 서로 공유합니다. 항상. 그런 다음 이 네트워크는 서로 대화하고 자체적인 인터넷 지도를 만드는 다양한 자율 시스템에 의해 구축됩니다. 뛰어나게, 2008년 파키스탄 정부가 유튜브 금지를 시도했을 때, BGP를 사용하여 YouTube를 블랙홀로 라우팅했습니다. 이는 해당 구성을 복사한 다른 자율 시스템과 공유되었기 때문에 거의 모든 YouTube 트래픽이 파키스탄의 블랙홀로 라우팅되었습니다. YouTube 자체는 전혀 문제가 없었지만 BGP 라우팅 남용으로 인해 웹사이트가 일시적으로 중단되었습니다.

페이스북의 역할

문제는 다음과 같습니다. Facebook은 자체 도메인 이름 서버 세트를 운영합니다. 이들은 귀하의 인터넷 서비스 제공업체와 해당 서비스 제공업체의 모든 중개자에게 이를 알리는 역할을 담당합니다. "facebook"(및 Instagram 및 WhatsApp과 같은 회사의 다른 모든 제품)이 실제로 연결되는 경로 이다. Facebook은 BGP 라우팅 정보를 자체 도메인 이름 서버로 전송하는 것을 중단했습니다. 이 정보는 전 세계 자율 시스템에 전송됩니다. 이는 페이스북이 인터넷과의 연결을 효과적으로 끊었다는 것을 의미합니다. 사이버보안 기자인 브라이언 크렙스는 "일상적인 BGP 업데이트가 잘못됐다"고 말했다.

Facebook의 초기 사후 분석에서는 다음과 같이 말했습니다.

우리 엔지니어링 팀은 데이터 센터 간의 네트워크 트래픽을 조정하는 백본 라우터의 구성 변경으로 인해 이러한 통신이 중단되는 문제가 발생한다는 사실을 알게 되었습니다. 이러한 네트워크 트래픽 중단은 데이터 센터의 통신 방식에 연쇄적인 영향을 미쳐 서비스를 중단시켰습니다.

나중에 회사에서 더 심층 분석 상황에 대해 더 많은 정보를 제공했습니다.

이러한 일상적인 유지 관리 작업 중 글로벌 백본의 가용성을 평가하기 위한 명령이 실행되었습니다. 의도치 않게 백본 네트워크의 모든 연결을 끊어 Facebook 데이터 센터의 연결을 효과적으로 끊는 용량 전 세계적으로.

그런 다음 Facebook은 DNS 서버가 데이터 센터와 통신할 수 없으면 BGP 광고를 철회한다고 설명했습니다. 이것이 Facebook을 나머지 세계와 단절시키고 DNS에 완전히 접근할 수 없게 만든 이유입니다. 회사에서는 문제를 해결하기 위해 엔지니어가 현장에 도착하는 것이 얼마나 어려웠는지에 대해서도 이야기했습니다. 여러 보고서에서 Facebook 직원이 자신의 정보를 입력하는 데 어떤 문제가 있었는지에 대해 이야기했기 때문에 이는 의미가 있습니다. 부엌.

글로벌 영향

Cloudflare의 뛰어난 글에서는 발견한 몇 가지 문제와 Facebook 서비스 중단으로 인한 일부 결과에 대해 자세히 설명합니다. Cloudflare는 자체 DNS인 1.1.1.1을 운영하고 있으며 공급자는 Facebook의 자체 웹사이트가 더 이상 확인되지 않는 것을 확인했습니다. 사실 그들은 자신들의 시스템에 문제가 있지 않을까 걱정했습니다. Facebook은 DNS에 대한 라우팅 정보 브로드캐스팅을 중단했습니다. 이는 DNS를 사용할 수 없음을 의미합니다.

Facebook이 경로 브로드캐스팅을 중단했을 때 DNS 확인자는 혼란에 빠졌습니다. Facebook에 지속적으로 다시 연결을 시도하는 애플리케이션과 인간의 행동 사이에도 Facebook 서버로 스팸이 발생하여 추가 DNS 트래픽의 "쓰나미"가 Cloudflare 서버에 타격을 입혔습니다. 서버.

웃기게도 일부는 화웨이 기기 소유자 더 이상 Wi-Fi 네트워크에 연결할 수 없다고 언급했습니다. Huawei는 어떤 방식으로든 Facebook 서버를 사용하여 인터넷 연결이 활성화되어 있는지 확인하고 있을 가능성이 있습니다. 불행한 우연이었을 수도 있다.

그래도 여전히 악화됩니다. Facebook이 다운되었을 때 Cloudflare는 Twitter, Signal, Telegram 및 TikTok과 같은 다른 플랫폼에 대한 쿼리가 증가했다고 언급했습니다. 트위터도 부하로 인해 어려움을 겪기 시작했고 잠시 동안 많은 생각 그것도 무너질 거라고.

Facebook으로 Single Sign-On을 사용하는 웹사이트에서도 많은 사용자가 로그인할 수 없어 문제가 발생했습니다. 전 세계의 서비스가 불만을 토로하면서 인터넷 전체가 여러 면에서 문제에 봉착했습니다. 몇 시간 후, 페이스북이 다시 온라인에 돌아왔습니다.

이 전체 실패가 한 가지 사실을 증명한다면 그것은 Electronic Frontier Foundation의 사이버 보안 책임자인 Eva Galperin입니다. 라고: "인터넷은 풍선껌과 끈으로 묶여 있다".