네이버클라우드는 9일 강원도 춘천에 위치한 네이버 자체 데이터센터(각 춘천)에서 지난 10년간 네이버 서비스 노하우를 공개하고 올 하반기 선보일 ‘각 세종’을 소개하는 테크포럼을 개최했다. 사진은 각 세종 서버실 모습./네이버 제공
네이버클라우드가 10년 동안 내재화한 데이터센터 설비 및 소프트웨어 관련 기술력, 10년 무사고의 운영 노하우를 소개하는 자리를 마련했다.
네이버클라우드는 9일 강원도 춘천에 위치한 네이버 자체 데이터센터(각 춘천)에서 지난 10년간 네이버 서비스 노하우를 공개하고 올 하반기 선보일 ‘각 세종’을 소개하는 테크포럼을 개최했다.
이날 발표자로 나선 네이버클라우드 데이터센터 노상민 센터장은 ‘무중단, 무사고, 무재해’를 각 춘천의 3대 운영 키워드로 꼽으며, 자사의 차별화된 기술과 역량에 대해 설명했다.
네이버는 2013년 6월13일 국내 인터넷 포털 기업 최초로 자체 데이터센터 ‘각 춘천’을 공개했다.
강원도 춘천시 구봉산 자락에 위치한 각 춘천은 축구장 7개 크기인 연면적 4만6850 m2(제곱미터), 약 10만 유닛(Unit, 서버의 높이 단위규격)의 서버를 수용할 수 있는 규모로 비수도권 최대 규모의 데이터센터로 설립됐다.
노 센터장은 현재까지 각 춘천은 네이버가 국내외 사용자들에게 연속성 있는 인터넷 서비스를 제공하는데 중추적인 역할을 하고 있으며 에너지 효율 등 ESG경영측면에서도 글로벌 선도 사례로 꼽히고 있다고 강조했다.
네이버클라우드는 각 춘천의 설계, 구축, 운영 전 단계에 걸쳐 전담 인력양성과 기술개발(R&D)에 공을 들였다. 외부에 의존하지 않고 데이터센터 운영체계를 확보할 수 있도록 전기·기계·제어·통신분야 등 다양한 직군에서 데이터센터 전문인력을 육성하고 기술역량을 내재화하고 있다.
데이터센터 설비와 서비스 운영에 필요한 시스템도 독자적으로 개발하고 있다.
장애 감지 및 분석 툴을 개발해 장애에 신속 정확하게 대응하고 있다.
네이버클라우드가 자체 개발한 서비스 장애 감지도구 WMS는 기존 상용 도구에서 감지하지 못했던 장애 전조증상 등을 감지할 수 있다.
종합 장애 분석 툴인 ‘Weave’ 역시 자체 개발 도구로 서비스 장애감지와 인프라 장애감지를 한 화면에서 볼 수 있도록 구성했다. 데이터베이스(DB), 네트워크, 서버 정보들이 함께 연동되어 있어 서비스 장애 시 종합적인 상황 분석과 효과적인 복구 지원이 가능하다.
이와 함께 지진, 정전, 화재, 산사태, 홍수 등과 같은 재난재해가 발생하더라도 서비스 지속성이 유지될 수 있도록 대비시설을 구축했다. 일례로 각 춘천의 모든 건물은 진도 6.5 이상을 견딜 수 있도록 내진 설계가 적용됐다. 이는 국내에 건설된 원자력 발전소의 내진설계과 동일한 수준이다.
또한 각 춘천은 한국전력의 전기 공급 이상으로 정전이 발생하는 경우를 대비해 서버에 끊김없이 전력을 공급할 수 있도록 다이나믹 전원공급장치(UPS)를 사용하고 있다.
다이나믹 UPS는 배터리 구성이 없는 발전기 일체형 UPS로 정전 발생 시 내부 정전 보상 장치 인덕션 커플링을 통해 회전 에너지를 전기에너지로 전환하여 약 5~7초 간 전원을 공급하고 일체형 비상용 발전기가 자동 기동하여 안정적으로 전원을 공급한다.
이후 각 춘천 지하 60만 리터 규모의 경유탱크 유류를 UPS에 공급해 약 70시간 이상 전력 중단 없이 데이터센터를 가동할 수 있도록 설계했다.
주변 산불 화재 발생 시에도 CCTV(열화상 폐쇄회로 TV)에 발열이 감지되면 화재 감지 소프트웨어가 실시간으로 보안관제센터 근무자에게 상황을 전달하고, 서버관 건물 옥상에 설치해둔 방수총에서 물을 분사해 화재확산을 막는다.
이 밖에 실제 데이터센터 내 다양한 장소에서 발생하는 화재에 대한 진압 및 대피, 인명 구조훈련을 위해 춘천소방서와 연 1회 민관합동소방훈련을 진행하고 있다.
네이버클라우드는 9일 강원도 춘천에 위치한 네이버 자체 데이터센터(각 춘천)에서 지난 10년간 네이버 서비스 노하우를 공개하고 올 하반기 선보일 ‘각 세종’을 소개하는 테크포럼을 개최했다. 사진은 그린에너지통제센터 및 IT서비스통제센터 모습./네이버 제공
◆ 재해복구 대비해 IDC 수도권 밀집 탈피…치밀한 네트워크 다중화 구성 및 서비스 분산 배치
데이터센터는 관련 인프라와의 접근성을 고려해 수도권에 위치하는 경우가 많지만 한 곳에 시설이 밀집해 있을 경우 재난 시 위기관리에 취약할 수 있다.
때문에 네이버클라우드는 수도권뿐 아니라 강원, 충북, 경남 등 다양한 지역에 자체 및 임대 데이터센터를 구축했다.
네이버는 세종특별시 첨단산업단지에 위치할 네이버의 제2 데이터센터인 각 세종 또한 각 춘천과 물리적 거리를 고려해 입지를 선정했다고 설명했다.
네이버는 네트워크 안정성을 위해 하나의 통신사업자가 아닌 다수의 통신사업자를 이용하고 있고, 데이터센터 내 네트워크 아키텍처의 처리 능력을 향상시키기 위해 스케일 아웃(Scale-Out) 구조 및 다중화로 구성해 충분한 용량을 확보하고 있다.
거미줄처럼 촘촘하게 구성된 네트워크 아키텍처 상에 서비스를 최적으로 분산 배치한 것이 강점으로, 어느 한 곳에 이슈가 발생하더라도 다른 곳에서 서비스를 제공할 수 있어 서비스가 중단되거나 데이터가 유실되는 사고를 방지하고 있다.
아울러 ‘데이터센터 상면용량 협의기구’를 구성해 서비스 안정성과 효율성을 높이고 있다. 데이터센터 기술을 개발하고 서비스를 제공하는 데이터센터 기획·기술 조직 및 서비스 인프라 매니저 조직, IT 인프라 엔지니어 조직과 같은 유관부서와 협의기구를 통해 상면 수요를 정확하게 예측하고 운용할 수 있도록 한다
데이터센터는 핵심 시설인 만큼 각종 법적 사항 준수와 인증 수행이 필요하다. 각 춘천 역시 개인정보보호법, 클라우드컴퓨팅서비스 정보보호에 관한 기준, 전자금융감독규정 등 다양한 규정을 준수하며, 서비스 운영 현황을 정기적으로 검증받고 있다. 네이버클라우드는 국내 CSP 중 가장 많은 13개의 정보보호인증을 획득했다.
◆BCP 포함 운영안정성 점검훈련 등 총 200회 이상 진행… AI업무비서 ‘웍스봇’을 통해 실시간 상황 전파
네이버클라우드의 업무연속성계획(BCP)는 어떠한 상황에서도 서비스를 지속하기 위한 목적으로 수립되었다. 대설 및 풍수해와 테러, 전염병 등에 대한 대응조치 매뉴얼이 실려있고 직무별 개인 행동 요령은 물론, 비상 시 연락망, 즉각적인 보고 체계뿐 아니라 부서별 액션 아이템도 상세하게 규정하고 있다.
네이버클라우드는 재해 발생시 컨트롤타워 역할을 하는 BCP 전담조직을 구성해 직무별 개인 행동 요령과 대응 프로세스 체계를 갖추고 재난별 위기 대응 매뉴얼에 맞춰 업무 연속성을 확보하고 있다.
일년에 2회 진행하는 BCP 모의훈련을 비롯해 연 1회 민관합동훈련, 월 1~2회 진행하는 운영안정성 점검훈 련 등 지난 10년간 약 200회 이상의 모의훈련을 진행했다.
지속적인 훈련으로 실제 재난 상황에서 빠른 의사결정, 네이버웍스의 AI업무 비서인 웍스봇(WORKS Bot)을 통한 임직원 간 커뮤니케이션, 가용 자원 파악 및 신속한 복구 등이 가능하도록 하고 있다. 웍스봇은 인프라 설비운영 전체직원을 대상으로 온·습도, 열 감지, 서비스 장애 등에 대한 정보를 실시간으로 전달한다.
실제 지난 1월 진행한 ‘각 춘천 본관 건물 화재상황’ 모의 훈련을 예로 들면, 화재 발생을 인지한 후 5분 이내 사고관리 담당이 임직원에게 SMS와 TTS(Trouble Ticket System)를 통해 상황을 전파했다. 이후 현장의 피해 규모와 상황에 대한 신속한 확인 요청을 통해 인명피해가 없는지 확인하고, 소방서 및 한국전력, 가스공사 등에 화재사실을 알리고 협조를 요청하는 프로세스로 훈련을 진행했다.
이후 화재가 확산될 경우 임직원 알림 단계를 ‘심각’ 단계로 격상하고, 서비스의 정상 유무를 확인해 필요 시 즉시 인프라 장비가 확충될 수 있도록 했다. 상황에 대한 보고는 CRO(Chief Risk Officer)에게 실시간 진행되며, 마지막 서비스까지 문제없이 복구될 수 있도록 한다.
노상민 네이버클라우드 데이터센터장은 “주요 서비스의 경우 장애대처의 골든타임 이내에 복구해야한다는 사명감을 가지고 있다”며 “서비스가 죽으면 안되고 데이터를 잃어버려서는 안 된다는 것이 네이버클라우드의 사명감”이라고 말했다.
네이버클라우드는 9일 강원도 춘천에 위치한 네이버 자체 데이터센터(각 춘천)에서 지난 10년간 네이버 서비스 노하우를 공개하고 올 하반기 선보일 ‘각 세종’을 소개하는 테크포럼을 개최했다. 사진은 각 세종 조감도./네이버 제공
◆친환경 데이터센터를 넘어 글로벌 ESG 경영 기업으로 자리매김
네이버클라우드 노상민 데이터센터장은 최근 데이터센터 운영기업이 ESG경영을 어떻게 실천하고 있는지에 대한 대중의 관심도 크다며 ESG에 대한 이야기를 이어갔다.
각 춘천은 친환경 데이터센터 기술의 집합체로, 다양한 자원을 재활용해 운영하고 있다.
수도권 대비 연중 기온이 2~3도 가량 낮은 춘천의 자연 바람을 활용해 서버실의 열기를 식히고 있는 것이 대표 사례다.
서버실에서 나오는 폐열을 바깥으로 버리지 않고 서버관 내 폐열 회수기에 모아, 도로 밑에 설치된 특수 배관을 통해 흐르는 부동액을 데우는 데 활용한다. 폐열은 겨울철 서버를 실은 대형 화물차량이 길에서 미끄러지지 않도록 하는 스노우멜팅 시스템 운영 등에 사용된다.
더불어 빗물을 우수조에 저장해 두었다가 조경용수 및 소방용수 등으로 재활용하고, 태양광 발전 시설을 설치해 매년 210MWh(메가와트시)의 전력을 절감하고 있다.
최근 네이버는 데이터센터 뿐 아니라 기업 차원에서의 ESG 경영도 적극 실천하고 있다. 지난 2022년 10월, 네이버는 RE100과 EV100을 동시에 가입한 세계 최초의 인터넷 포털 기업이 됐고, 12월에는 글로벌 ESG 평가기관인 MSCI로부터 최고등급 AAA를 2년 연속 획득하며 ESG 경영의 선도 기업으로 자리매김하고 있다.
네이버의 두 번째 자체 데이터센터인 '각 세종'은 올해 2분기 내 준공을 완료하고 3분기에 실가동을 목표로 한다.
미래형 로봇 데이터센터로 탄생할 각 세종은 각 춘천의 6배 규모인 29만3697m2 대지 위에 세워지는 하이퍼스케일 데이터센터로 수전 용량 또한 각 춘천의 6.7배인 270MW(메가와트)에 달한다.
네이버는 각 세종이 약 60만 유닛 이상의 서버를 수용할 예정으로 빅데이터, 인공지능(AI), 로봇 등 팀 네이버의 기술 역량을 모아 세계 최고 수준의 인프라로 클라우드 산업의 핵심 동력으로 자리잡을 것으로 기대하고 있다.
네이버는 각 춘천을 10년간 운영하며 쌓아온 노하우와 경험을 기반으로, 각 세종을 IT 집적도가 높고 생산성과 안정성을 높인 데이터센터로 선보인다는 계획이다. 특히 지난해 완공한 테크컨버전스 빌딩인 네이버 제2사옥 '1784'에 이어 '각 세종'에도 로봇과 자율주행 등의 첨단 기술을 대거 적용할 예정이다. 1784가 사람과 로봇의 공존을 중심으로 설계되었다면, '각 세종'에서는 로봇, 자율주행셔틀 등을 활용해 데이터센터 현장 업무의 생산성을 보다 높이는 것을 목표로 하고 있다.
뿐만 아니라 향후 20년간 IT 서비스를 안정적으로 공급할 수 있도록 건축에서부터 에너지 효율을 고려한 설계로 친환경 재생 에너지를 적극 활용해 정부의 온실가스 감축과 탈원전을 대비할 예정이다.
정수환 네이버클라우드 IT서비스본부장은 “네이버클라우드는 로봇, AI, 클라우드 등 첨단 기술에 대한 아낌없는 투자를 바탕으로 서비스 안정성을 이어갈 것”이라며 “향후 클라우드 산업의 근간인 미래형 데이터센터를 통해 글로벌에서도 경쟁력 있는 클라우드 비즈니스를 전개해 나가겠다”고 강조했다.
이어 “각 세종은 최근 주목받고 있는 네이버의 초대규모 AI 하이퍼클로바가 성장하고 전세계로 뻗어나가는 근간이 될 것”이라고 덧붙였다.