통상 한회사가 다른 회사를 인수 또는 합병한 이후 경영효율화와 비용절감 등을 이유로 해고와 구조조정이 뒤따른다. 일론 머스크가 지난달 28일(현지시각) 트위터를 최종 인수한 후 1주일 새에도 급작스레 이런 일이 발생했다. 인수에는 으레 잡음이 있기 마련이지만 트위터 인수후 잡음은 그야말로 엄청난 것이었다.
일론 머스크가 트위터 최고경영자(CEO)가 된 이후 감원과 근무방식의 변화 등 직원들에 대한 거친 경영방식 적용으로 소프트웨어 엔지니어의 수는 크게 줄었다. 이들은 트위터가 너무 심하게 닳아서 곧 실제로 추락할 수도 있다고 생각하고 있다고 한다. 인수 당일 파라그 아그라왈 전 트위터 CEO 등 주요 임원 4명을 해고한 건 그렇다 쳐도 7500명의 직원 가운데 절반인 3400명이나 해고했다. 이 가운데 필수기술 인력까지 들어있어 뒤늦게 돌아와 달라고 부탁하는 촌극까지 연출했다.
이처럼 좌충우돌하는 괴짜 세계최고 부자의 트위터 인수후 사나흘 간의 행적을 보고 이미 트위터가 무너지고 있다며 트위터의 위기를 분석 전망한 매체들까지 나왔다. 이들은 머스크의 직원해고로 시스템 유지보수가 안되면서 버그 발생이 시작됐고, 이것이 트위터의 균열과 붕괴를 동시에 가져온 시작점이 되고 있으며, 이는 시스템 유지담당 및 우수 두뇌유출이 뒤따르며 가속됐다고 보고 있다. 또한 대형 트래픽 발생시 대처하지 못하고 언제든 충돌이 발생할 가능성이 높다고 내다봤다. 게다가 ‘마스토돈’이란 존재감도 미미한 SNS는 머스크가 자만심속에 깨방정떨며 언급한 트윗 이후 50만명이나 가입하는 모습을 보였다고 한다. 문제 해결책은 원인을 제거하고 거기에 뭔가 혁신적 처방을 더하는 일일 것이다.
가장 큰 원인은 머스크에게 있어 보인다. 그가 오면서 회사를 개혁하겠다고 나선 것 같지만 지금 상황을 보면 새 CEO이후 오히려 회사를 새로이 결집시킬 필수조건인 인화단결이 망가진 것 같다. 머스크로선 무자비한 직원 해고와 서버 운영비 절감이 사전에 계획된 그림이기에 섣불리 뒤집으려다간 그림을 망칠 수도 있어 보인다. 제자리로 돌려놓기가 쉽지만은 않아 보이는 이유다.
창업 이후 16년 동안 전 세계의 많은 사람들에게 입과 눈, 귀 역할을 해 온 트위터가 왜 위기라고 하는지 MIT테크놀로지리뷰와 포춘의 분석을 참고해 살펴봤다. 두 매체의 지적은 주로 기술자 유출로 인한 시스템 붕괴가 회사를 어렵게 만들고 있다는 것에 집중되고 있다. 하지만 이건 누가 봐도 CEO 리스크다. 즉, 머스크의 문제다. 우리는 저커버그가 메타버스에 집중한다며 과도하게 투자하면서 회사(메타)를 위기에 빠뜨리고 스스로 이를 인정한 저커버그 메타 CEO의 최근 사례를 알고 있다.
“트위터 점진적이지만 수소탄보다 더 큰 붕괴”···버그가 늘기 시작
일론 머스크가 이전에 트위터에서 일했던 7,500명의 직원 중 절반을 해고한 것은 엄청난 사건이지만 사실은 속으로 금이 가기 시작했는지 모른다.
트위터와 같은 거대한 기술 플랫폼은 매우 많은 상호의존적인 부분들 위에 구축된다. IT업계에서 20년 이상의 경험을 가진 사이트 신뢰성 엔지니어인 벤 크뤼거는 “이것들은 매우 크고, 매우 복잡한 시스템”이라고 말한다.
그는 “2017년 트위터 직원들이 발표한 한 프레젠테이션에 백엔드 인프라의 절반 이상이 데이터 저장 전용이라는 것을 시사하는 통계가 포함되어 있다”고 말한다.
머스크를 반대하는 사람들 중 많은 사람들이 플랫폼이 수소폭탄 파괴와 동등한 과정을 거치기를 바랄 수 있지만, 트위터와 같은 것의 붕괴는 점진적으로 일어난다. 아는 사람들에게 점진적인 고장은 더 큰 붕괴가 임박할 수 있다는 우려의 신호이다. 그리고 그것이 지금 일어나고 있는 일이다.
어쨌든 지금 트위터 주변에 작은 버그가 나타나고 있다. 머스크가 지난 11월 7일 링크한 트위터의 규칙조차 일시적으로 오프라인 상태가 됐다. 간단히 말해서, 그것은 신뢰할 수 없게 되돼 가고 있다.
트위터에서 일하는 한 엔지니어는 이전에 사이트를 원활하게 운영하기 위해 고용되었던 많은 동료들이 조용히 해고된 후 플랫폼이 어떻게 반응하는지를 걱정한다. 트위터는 한때 대규모 시스템 정지로 어려움을 겪은 이후 결국 사이트 안정성 엔지니어 팀(SRE)으로 찬사를 받았지만 머스크 인수 여파로 이 팀이 사라졌다. 이 엔지니어는 “현재로서는 작은 일이지만 안정성에 대한 인식만큼 중요하다”라고 말한다.
그는 잘못된 문제에 대한 작은 제안은 시간이 지남에 따라 증폭되고 증가할 것이라고 예상한다. 부분적으로는 이러한 문제를 처리하기 위해 남아 있는 인력이 빠르게 소진될 것이기 때문이다. 이 엔지니어는 안정성 문제가 “24시간 내내 품질에 해를 끼치고 있으며, 우리는 이미 이것을 보고 있다”고 말했다.
코드 기반 유지 직원 해고돼 안정성 붕괴···예상밖 트래픽 급증시 문제
머스크는 “트위터가 작동하는 데 실제로 필요한 것은 20% 미만이다”라고 트위터에 올렸다.
그래서인지 그는 트위터의 코드 기반을 유지하는 담당 직원 상당수를 제거했다.
하지만 이는 머스크가 무슨 일을 하고 있는지 전혀 모르는 것이라고 말한 엔지니어들의 반대에 직면했다.
전 우버 프로그래머인 게젤리 오로스즈는 “마이크로 서비스는 대부분의 현대 대형 웹 서비스가 소프트웨어 엔지니어들이 빠르고 효율적으로 작업할 수 있도록 코드를 구성하는 방법이다”라고 말했다. 그는 “이러한 서비스에는 수십 가지가 있으며 각각 다른 기능을 관리한다. 시뮬레이션된 실제 환경에서 마이크로 서비스의 제거를 테스트하는 대신, 머스크의 팀은 분명히 모든 사람의 컴퓨터에서 트위터 라이브를 업데이트해 왔다”고 말했다.
남은 엔지니어들은 그동안 사이트를 안정적으로 유지하는 임무를 주로 맡았다.
그런데 이후 실제로 한 마이크로 서비스가 잠시 중단됐다. 즉, 사람들이 로그인할 때 SMS 메시지를 통해 트위터에 자신의 신원을 확인하는 데 사용하는 서비스였다. 이를 이중 인증(two factor authentification)이라고 한다.
회사가 어느 정도 정상으로 돌아가려고 노력하면서, 그들이 담당한 업무의 더 많은 부분이 기존 시스템 운영상의 많은 부분을 유지하기보다는 신제품과 기능과 관련한 머스크의 변덕에 대처하는 데 사용될 것이라는 지적과 전망도 나온다.
벤 크뤼거 엔지니어는 “이것은 사용자 트래픽과 관심이 예상치 못한 급증을 일으킬 수 있는 트위터와 같은 사이트에 특히 문제가 있다”고 말한다.
크뤼거는 트위터를 블랙 프라이데이와 같은 큰 트래픽 이벤트를 어느 정도 예측 가능하게 준비할 수 있는 온라인 소매 사이트와 비교해 설명한다. 그는 “트위터에 관한 한, 그들은 하루 중 언제든지 주어진 날에 블랙 프라이데이를 가질 가능성이 있다”고 말했다.
그는 “언제든지 대화에 상당한 영향을 미칠 수 있는 뉴스 이벤트가 발생할 수 있다. 최대 80%의 사이트 신뢰성 엔지니어를 해고했을 때 남아있는 사람들이 이에 대응하는 것은 더 어렵고 말한다.
실제로 트위터는 20일 개막하는 2022년 FIFA 월드컵을 준비하는 순간에 많은 작업자들을 잃고 시작하고 있다. 트위터로선 가장 바쁜 행사 중 하나로, 트윗이 몰리면 시스템에 큰 스트레스를 주게 된다.
베테랑 사이버 보안 기업가인 로버트 그레이엄은 “그가 트위터를 폭파할 것처럼 보인다”며 “최근 많은 트위터 탈퇴자들이 더 점진적인 사망을 예측했지만 나는 어떻게 불이 언제 꺼지는지 알 수 없다”고 말했다.
트위터의 한 엔지니어는 “만약 트위터가 서버를 폐쇄하고 있는 가운데 갑자기 대량 트윗량이 들어오면, 그것은 충돌하기 시작할 수 있다”고 지적했다. 그는 “월드컵은 트위터의 가장 큰 이벤트다. 그것은 당신이 트위터에 접속할 때 가장 먼저 배우는 것이다”라고 말했다.
트위터의 또다른 엔지니어는 해고를 번복하는 것 외에는 이 문제에서 벗어날 방법이 없다고 생각한다고 보고 있다. (이미 알려진 대로 머스크도 뒤늦게서야 이 문제에 따른 사태의 심각성을 깨닫고 돌아오라고 요청하는 촌극을 빚었다. 머스크는 지난 17일밤 트위터를 통해 “최고의 사람들이 머물고 있기 때문에 크게 걱정하지 않는다”면서 “아직 그만두지 않은 기술자라면 누구든지 비행기에 태우겠다”고도 했다. 그는 지난 19일 오후 2시 트위터 10층의 사령부로 “실제로 소프트웨어를 만드는 사람”을 소환하는 이메일을 보냈다. 포춘은 18일 회사를 그만뒀음에도 여전히 회사 이메일을 받고 있는 직원의 말을 인용, 그가 현지근무가 아니라면 샌프란시스코로 날아올 것을 요청받았다고 전했다.)
벤 크뤼거 엔지니어는 유지보수 작업과 수정 작업의 백로그가 점점 길어짐에 따라 문제가 쌓이는 디스토피아적인 미래를 제시하면서 “모든 것이 깨질 것이다. 물건들이 더 자주 부서질 것이다. 물건들은 더 오랜 시간 동안 깨질 것이다. 상황은 더 심각한 방식으로 깨질 것이다. 결국 사용할 수 없게 될 때까지 모든 것이 복잡해질 것이다”라고 비유적으로 말했다.
두뇌 유출
한편 두뇌유출도 이어지고 있다. 일이 터지면 문제가 발생할 때 신속하게 해결할 수 있는 제도적 지식이 더 이상 없어진다는 의미다.
트위터의 한 엔지니어는 “4일 이후 떠나는 많은 사람들이 9년, 10년, 11년 동안 그곳에 있었는데, 이는 기술 회사로서는 터무니없는 일이다”라고 말한다.
그 사람들이 트위터 사무실을 나오면서, 트위터 시스템이 어떻게 작동하는지에 대한 수십 년의 지식이 그들과 함께 사라졌다. (트위터 내부의 사람들과 옆에서 지켜보는 사람들은 이전에 트위터의 지식 기반이 소수의 프로그래머들의 마음에 지나치게 집중되어 있고, 그들 중 일부는 해고됐다고 주장했다.)
외부에서 답을 얻는 것은 더 어려울 것이다. MIT 테크놀로지 리뷰와 통화한 한 전직 팀원에 따르면 80~100명이었던 통신팀은 단 두 명으로 줄었다. 이 엔지니어는 “그들이 해야 할 일이 너무 많고, 그들은 필요한 만큼 언론을 다루기에 충분한 언어를 구사하지 못한다”고 말했다.
이런 상황은 트위터 내부 직원의 인화단결을 망가뜨리고 있는 것으로 보인다.
머스크가 18일 저녁까지 극도로 힘든 작업을 약속하거나 퇴직금을 받고 사임할 것을 요구하자 수백 명의 기술자와 다른 노동자들이 그 후 즉각 그만두었다. 직원들이 머스크 선장이 이끄는 트위터에 미련이 없다는 것을 보여주는 단적인 사례로 꼽을 수 있다.
아직 떠나지 않은 트위터 직원들에 따르면 수백 명의 직원들이 18일 이전에 작별 메시지, 경례 이모티콘 또는 기타 친숙한 기호를 회사 내부 슬랙 메시지 게시판에 게시하며 떠날 것임을 알렸다. 수십 명은 또한 트위터에 공개적으로 참여하여 탈퇴를 선언했다.
엔지니어들, "핵심 인력 유출 후 새로 시스템 가동 교육엔 6개월"
핵심 서비스에서 일했던 새로 퇴사한 트위터 엔지니어 중 한 명은 리더를 포함해 16명의 엔지니어가 있었던 AP 팀은 18일 모두 퇴직하기 직전까지 3~4명으로 줄었다고 말했다. 하루아침에 대체할 수 없는 더 많은 제도적 지식이 회사를 떠난 것이다. 이 프로그래머는 “모든 것이 부서질 수 있다”고 말했다.
엔지니어들은 일부 서비스에 대해 당직 교대 근무를 하도록 누군가를 훈련시키는 데 6개월이 걸린다고 말했다. 이러한 로테이션을 위해서는 프로그래머들이 항상 이를 사용할 수 있어야 한다. 그러나 담당자가 코드 베이스에 익숙하지 않으면 참조 매뉴얼을 필사적으로 검토하면서 실패가 연쇄적으로 발생할 수 있다.
트위터에서 퇴직한 피터 클로우즈 엔지니어는 트위터에 “만약 내가 머물렀다면 내가 경험하지 못한 몇 가지 추가적인 복잡한 시스템에 대해 불확실한 시간 동안 거의 지원받지 못한 채 계속해서 당직을 섰을 것”이라고 말했다.
이와 관련, 지난 2008년에 떠난 트위터의 창립 엔지니어인 블레인 쿡은 “상대적으로 지루한 시스템조차도 무언가가 고장 났을 때 어디로 가야 하는지 아는 사람들을 데려간다”며 “먼저 코드를 방탄하지 않고 프로그래밍 인력을 최소인력으로 대폭 줄이는 것은 위험하다. 이것은 마치 ‘이 소방관들은 아무것도 하지 않고 있다. 그래서 우리는 그냥 그들을 모두 해고할 것이다’라고 말하는 것과 같다”고 꼬집었다.
엔지니어들은 또한 머스크가 콘텐츠 조정과 관련된 도구들을 폐쇄하고 사람들이 트위터에 업로드하는 불법 자료들을 제거할 것을 우려하고 있다. 또는 단순히 직원들이 그것들을 제대로 운영할 만큼 충분하지 않을 것이다.
또 다른 우려는 해커들이다. 그들이 과거에 시스템을 침해했을 때 피해를 줄이는 것은 그들을 신속하게 감지하고 쫓아내는 것에 달려 있다.
사이버 보안 베테랑인 그레이엄은 “트위터 같은 큰 조직의 보안 인프라의 많은 부분이 사람들의 머릿속에 있다. 그리고 알다시피 그들이 사라지면 모든 것은 그들과 함께 가버린다”고 말했다.
수동 리트윗과 팔로워 흔들리는 등 완만한 붕괴
벤 크뤼거 엔지니어는 트위터를 자동차에 비유하면서 “자동차가 사용할 수 없는 비참한 잔해가 되기까지 시간이 좀 걸릴 것이다. 하지만 부식되는 징후는 이미 뚜렷하다. 그것은 작은 것들로 시작한다. 어떤 고객이 어떤 부분, 어떤 백엔드 서비스를 사용하든 간에 버그가 발생할 것이다. 처음에는 약간의 번거로움에서 시작하겠지만 백엔드 수정이 지연되고 있기 때문에 결국 누적될 것이고 사람들이 사용을 포기하게 될 것이다”라고 말했다.
그는 또 “...우리는 더 많은 트윗들이 로딩되지 않고, 계정들이 겉보기에 변덕스럽게 들어오고 나가는 것을 보기 시작할 것이다. 백엔드에서 데이터를 쓰는 모든 것은 속도가 느리고 시간이 초과되며 훨씬 더 미묘한 유형의 장애 조건이 있을 것으로 예상한다...하지만 그들은 종종 더 음흉하다. 그리고 그들은 또한 일반적으로 추적하고 해결하기 위해 훨씬 더 많은 노력을 필요로 한다. 엔지니어가 충분하지 않다면, 그것은 중대한 문제가 될 것이다”라고 말했다.
수동 리트윗과 팔로워 수가 흔들리고 있는 것은 이미 이러한 일이 일어나고 있음을 보여주는 징조로 읽힌다. 트위터 엔지니어들은 기능이 완전히 오프라인이 되지 않고 대신 컷다운 버전이 제공되도록 플랫폼이 다시 의존할 수 있는 페일 세이프 설계를 했다. 그것이 우리가 보고 있는 것이라고 크뤼거는 말한다.
머스크, “트위터에 실망한 사람들 마스토돈으로 가라”
게다가 머스크는 깨방정까지 떨어서 가뜩이나 그에게 반감을 갖고 있는 사용자들을 흔들어댔다.
일론 머스크 트위터 CEO는 사용자들에게 “만약 당신이 더 이상 트위터를 좋아하지 않는다면, ‘마스터배이티드던 (Masterbatedone)’이라는 멋진 사이트가 있다”고 말한 게시물을 트위터에 올렸다가 재빨리 삭제했다. (머스크는 트위터의 대안인 오픈소스 기반의 마스토돈(Mastodon)을 ‘마스터베이션’의 파생단어를 가지고 교묘하게 말장난해 자신의 트위터에 실망한 사용자들에게 비아냥댄 것으로 보인다.)
그 단어와 함께 폴 크루그먼의 마스토돈 프로필에 열려 있는 그의 노트북 화면의 실제 사진이 있었고, 경제 칼럼니스트가 여러 번 게시하려고 시도하는 것을 보여주었다.
마스토돈의 신뢰성이 떨어진다는 점을 강조하려는 머스크의 시도에도 불구하고 머스크가 트위터를 인수한 이후 이 사이트에 거의 50만 명의 사람들이 가입했다. 결국 머스크의 깨방정은 역효과만 낸 셈이 됐다.
이같은 현상은 트위터의 건물에 첫 번째 균열이 나타나기 시작하는 것과 동시에 일어나고 있다. 크뤼거 엔지니어는 “이제 시작일 뿐”이라고 예상한다. 그는 앞서 “6개월 안에 이 기술과 관련해 대중에게 심각한 문제가 발생할 것으로 예상한다고 말했었는데 “이제 나는 그것이 관대한 평가였다고 생각한다”고 말한다.
컴퓨팅 서버로드 비용 절감하려다 블랙아웃 발생할 것
트위터의 한 엔지니어는 “사소한 오작동과 함께 부분적으로는 인프라 비용에서 하루 최대 300만 달러(약 40억원)를 회수하기 위해 트위터의 클라우드 컴퓨팅 서버 로드를 줄이려는 머스크의 노력 덕분에 상당한 블랙아웃이 발생할 것이라고 믿고 있다. (머스크는 뱅크오브아메리카와 모건스탠리로부터 인수비용 440억달러중 130억달러를 빌렸다. 세계최대 거부인 그가 돈을 빌린 것은 절세 때문이라고 한다.)
로이터통신은 머스크의 워룸(war room)에서 나온 이 프로젝트의 이름이 ‘딥 컷스 플랜(Deep Cuts Plan)’, 즉 ‘대 삭감 계획’이라고 보도했다.
로이터 통신의 소식통 중 한 명은 이 아이디어를 “망상적”이라고 불렀다. 영국 서리 대학의 사이버 보안 교수인 앨런 우드워드는 “그들이 현재의 시스템을 엄청나게 과도하게 조작하지 않았다면, 더 낮은 용량과 가용성의 위험은 논리적인 결론으로 보인다”고 말했다.
CEO가 들어오면서 이번 사례처럼 급작스레 회사가 위기상황에 빠지는 사례도 드물어 보인다.
과연 세계최고의 부자 일론 머스크는 이를 해결할 수 있을까. 해결 하더라도 현재의 진통상황은 쉽사리 진정되지 않을 것 같다. 이번 건은 스페이스X의 우주발사대에서처럼 과학적인 방식에 맞춰 발사자의 마음에 맞게 일정을 조정하고 직원들을 채찍질하면 되는 물리적 방식이 큰 비중을 차지한다. 하지만 트위터 비즈니스는 직원의 마음을 얻는 것은 물론 고객의 마음을 얻는 영역이 큰 비중을 차지한다. 일론머스크는 트위터 인수후 비효율적이라고 본 부분에 대한 과감한 구조조정을 했다지만 결과적으로 직원의 마음과 고객의 마음을 사는 일을 모두 그르쳐 버렸고, 그래서 기술적으로도 사달이 났다. 그래서 트위터란 회사는 이제 외부의 제3자가 보기에도 위험해 보인다.
소셜댓글