IT

클라우드 의존도 높아지는 세상, '먹통' 사태로 드러난 위험과 대안

선재관 2024-07-23 06:00:00
MS 클라우드 장애로 전 세계 마비... 멀티 클라우드 전략 필요성 대두
마이크로소프트 애저 클라우드의 서버 모습 [사진=MS]

[이코노믹데일리] 지난 19일(이하 현지시간) 마이크로소프트(MS)의 클라우드 서비스 '애저(Azure)'에서 발생한 대규모 장애로 전 세계가 일시적으로 마비되는 초유의 사태가 벌어졌다. 항공, 금융, 방송, 병원 등 주요 인프라가 일제히 먹통이 되면서 현대 사회의 클라우드 의존도가 얼마나 높아졌는지 여실히 드러났다. 이번 사태를 계기로 클라우드 서비스의 안정성과 리스크 관리에 대한 논의가 활발히 이뤄지고 있다.

◆ 전 세계를 뒤흔든 MS 클라우드 장애

이번 장애의 주요 원인은 MS의 클라우드 서비스인 애저에서 사용하는 미국 사이버보안 업체 크라우드스트라이크의 백신 소프트웨어 업데이트 과정에서 발생한 오류로 밝혀졌다. 이 오류로 인해 윈도우 운영체제를 사용하는 전 세계의 기기들이 직접적인 영향을 받았고, 많은 PC에서 '블루스크린' 오류 화면이 나타났다.

장애의 영향은 광범위했다. 미국 주요 항공사의 모든 국제 항공편이 지연됐고 호주, 독일, 스페인, 인도, 홍콩 등 세계 각국의 공항에서 체크인 시스템이 마비돼 승객들이 장시간 대기하는 사태가 벌어졌다. 국내 항공사들도 예약·발권 시스템 오류로 어려움을 겪었다.
 
19일(현지시간) 스페인 마드리드 바라하스 국제공항에서 체크인 절차가 지연되면서 승객들이 하염없이 기다리는 가운데 안내 화면에는 블루스크린이 떠 있다. 전날 마이크로소프트 클라우드 애저의 서비스가 중단된 영향으로 미국을 비롯해 호주, 영국, 독일, 스페인 등이 공항 운영에 차질을 빚었다. [사진=로이터·연합뉴스]

금융권과 언론계도 혼란에 빠졌다. 영국의 스카이뉴스는 기술적 문제로 생방송 송출을 중단했고, 런던증권거래소는 전날 마감 가격이 그대로 표시되는 등의 문제가 발생했다. 이스라엘과 독일의 병원들은 시스템 이상으로 수술을 취소해야 했고, 네덜란드 로테르담 항구와 폴란드 그단스크 항구의 컨테이너 터미널 운영에도 차질이 빚어졌다.

국내에서도 여파가 있었다. 펄어비스의 '검은사막'과 그라비티의 '라그나로크' 시리즈 등 일부 온라인 게임 서비스에 장애가 발생했다. 이는 글로벌 정보기술(IT) 서비스의 상호연결성이 얼마나 높아졌는지를 보여주는 단적인 예다.

◆ 클라우드 시장의 급성장과 '빅3' 의존도

이번 사태는 급성장하고 있는 클라우드 시장의 현주소를 여실히 보여줬다. 시장조사기관 가트너에 따르면 올해 전 세계 클라우드 시장 규모는 6787억 달러(약 929조2000억원)로 전년 대비 20% 성장할 것으로 예상된다. 더욱이 2027년까지 전 세계 기업의 70% 이상이 클라우드 플랫폼을 사용할 것으로 전망된다.

현재 글로벌 클라우드 시장은 아마존웹서비스(AWS), MS의 애저, 구글 클라우드 등 이른바 '빅3'가 주도하고 있다. 올 1분기 기준 이들의 시장 점유율 합계는 67%에 달한다. 국내 시장도 예외는 아니다. 과학기술정보통신부의 '2023년 부가통신사업 실태조사 결과'에 따르면, AWS(60.2%), MS 애저(24%), 네이버클라우드(20.5%) 순으로 클라우드 서비스 이용률이 높았다.

이처럼 소수 기업에 대한 의존도가 높아지면서 리스크도 커지고 있다. 한 업체의 서비스에 문제가 생기면 그 영향이 전 세계로 퍼질 수 있다는 점이 이번 사태로 입증됐다.

◆ 멀티 클라우드 전략의 필요성

이번 사태를 계기로 멀티 클라우드 전략의 필요성이 대두되고 있다. 멀티 클라우드란 2개 이상의 클라우드 서비스를 동시에 이용하는 전략을 말한다. 특정 클라우드에 지나치게 의존할 경우 위험도가 커질 수 있기 때문에, 리스크를 분산시키는 방안으로 주목받고 있다.

현재 국내에서 멀티 클라우드를 이용하는 비율은 44.7%다. 하지만 전문가들은 이 비율이 더 높아져야 한다고 지적한다. 한 클라우드 서비스에 문제가 생겼을 때 다른 서비스로 신속하게 전환할 수 있는 체계를 갖추는 것이 중요하다는 것이다.

다만 무조건 많은 클라우드 서비스를 이용하는 것이 능사는 아니라는 의견도 있다. 생산성과 비용 측면에서 오히려 비효율적일 수 있기 때문이다. 따라서 기업은 자신의 핵심 업무에 가장 적합한 클라우드 서비스를 선별적으로 선택하고, 필요에 따라 서비스 간 전환이 가능한 체계를 구축해야 한다.

◆ 소프트웨어 공급망 보안의 중요성

이번 사태는 소프트웨어 공급망 보안의 중요성도 다시 한번 일깨워줬다. 소프트웨어 공급망이란 소프트웨어가 개발, 배포, 설치되는 전체 과정을 말한다. 이번에는 보안 소프트웨어의 업데이트 과정에서 문제가 발생했지만, 악의적인 해커가 이 과정을 노릴 경우 더 큰 피해가 발생할 수 있다.
 
블루스크린이 떠 있는 사용자 PC. 전날 마이크로소프트 클라우드 애저의 서비스가 중단된 영향으로 미국을 비롯해 호주, 영국, 독일, 스페인 등이 공항 운영에 차질을 빚었다. [사진=선재관 기자]

가트너의 보고서에 따르면 소프트웨어 공급망 공격으로 인한 비용은 지난해 460억 달러에서 2031년 1380억 달러로 증가할 전망이다. 특히 기업들이 사용하는 소프트웨어의 90% 이상이 오픈소스에 종속돼 있는데, 이 중 74%가 고위험군이란 분석이다.

◆ 클라우드 시대의 미래 전망

클라우드 서비스가 급속도로 확산되는 이유는 그만큼 장점이 많기 때문이다. 첫째, 비용 절감 효과가 크다. 기업은 고가의 하드웨어와 소프트웨어를 직접 구매하고 유지·관리할 필요 없이, 필요한 만큼만 서비스를 이용하고 비용을 지불할 수 있다. 둘째, 유연성과 확장성이 뛰어나다. 비즈니스 요구사항의 변화에 따라 신속하게 자원을 확장하거나 축소할 수 있다. 셋째, 접근성이 좋다. 인터넷만 연결돼 있다면 언제 어디서나 필요한 데이터와 애플리케이션에 접근할 수 있다.

그러나 이번 사태에서 드러났듯이 단점도 존재한다. 가장 큰 문제는 보안과 안정성이다. 데이터가 외부 서버에 저장되기 때문에 해킹이나 데이터 유출의 위험이 있고, 서비스 제공업체의 장애가 곧바로 기업 활동의 마비로 이어질 수 있다. 또한 인터넷 연결에 전적으로 의존하기 때문에 네트워크 문제가 발생하면 서비스 이용이 불가능해진다.

클라우드 기술은 계속 발전하고 있다. 앞으로 엣지 컴퓨팅, 서버리스 컴퓨팅, 멀티 클라우드 환경 등이 더 주목받을 것이다. 특히 5G 기술이 보급되면 엣지 컴퓨팅의 중요성이 더 커질 것으로 전망된다. 엣지 컴퓨팅은 데이터를 중앙 서버가 아닌 데이터가 생기는 곳에서 처리해 지연 시간을 줄이고 실시간 처리를 가능하게 한다.

또한 인공지능(AI)과 머신러닝 기술의 발전으로 클라우드 서비스는 더 똑똑해질 것이다. 예를 들어 자동화된 보안 시스템이 실시간으로 위협을 탐지하고 대응하거나, 비즈니스 인텔리전스 도구가 클라우드에 저장된 빅데이터를 분석해 의미 있는 인사이트를 도출하는 등의 서비스가 보편화될 것이다.

이제 클라우드 서비스는 선택이 아닌 필수가 되고 있다. 기업들은 비용을 절감하고 효율성을 높이기 위해 클라우드를 도입하고 있으며, AI 기술의 발전으로 클라우드 수요는 더 늘어날 것이다.

하지만 이번 사태는 클라우드에 너무 의존하면 위험할 수 있다는 것을 보여줬다. 따라서 기업들은 클라우드 전략을 다시 점검하고, 리스크 관리 방안을 마련해야 한다. 멀티 클라우드 전략 도입, 소프트웨어 공급망 보안 강화, 자체 백업 시스템 구축 등이 그 방안이 될 수 있다.

정부와 관련 기관들도 클라우드 서비스의 안정성과 보안성을 높이기 위한 제도적 장치를 마련해야 한다. 클라우드 서비스 제공업체들에 대한 관리·감독을 강화하고, 장애 발생 시 빠른 대응과 복구를 위한 가이드라인을 제시해야 할 것이다.

클라우드 시대의 편리함 뒤에 숨어있는 위험을 인식하고, 이에 대비하는 것이 우리 모두의 과제다. 이번 사태를 교훈 삼아 더욱 안전하고 안정적인 클라우드 환경을 만들어가는 노력이 필요한 시점이다.