[Tech & Trend]데이터 저장의 새로운 패러다임

관련 통계자료 다운로드 CPU와 스토리지의 불균형

 돌이켜 보면 IT 기술은 놀랄만한 속도로 변해 왔다. 우리가 일상적으로 사용하는 단위만 가지고 30여년 전과 대충 비교해 보자. 일단 CPU는 1000배 빨라졌다. CPU 속도 단위가 Mhz에서 Ghz로 바뀌었다. 메모리는 KB에서 GB로 백만배로 커졌다. 당시 빌 게이츠 조차도 메모리는 64KB면 충분하다고 했는데 그 역시 이렇게 세상이 바뀔 줄 예측 못했다. 스토리지의 수용량 역시 MB에서 TB로 백만배로 커졌다.

 이처럼 향상된 IT 기술에 도대체 뭐가 문제일까? 가장 큰 문제는 IT의 성능을 구성하는 기기의 불균형적인 발전이다. 그 중에 가장 심각한 것이 스토리지의 속도다.

 황의 법칙대로 데이터는 매년 배로 늘어나 이제 수용량은 30년 만에 백만배가 필요해졌지만 스토리지의 속도 발전은 그에 비하면 조족지혈이다. 스토리지의 속도 한계는 회전 속도에 크게 좌우 된다. 하드디스크는 초당 3600회전(3600RPM)에서 7200RPM, 1만RPM으로 발전하고 이제 겨우 1만5000RPM으로 4배 빨라졌다.

 이 기계적인 회전 속도에 의한 지연시간(latency)은 HDD로서는 피할 수 없는 치명적 약점이다. 그래서 전통적으로 넓은 대역폭을 필요로 하는 대규모 데이터센터는 대역폭을 확보하기 위해 엄청난 공간과 전력, 비용을 들여서 수많은 HDD를 병렬로 구성하는 방법을 썼다.

 1999년 SGI의 수석과학자인 존 매시(John Mashey)는 이렇게 말했다. “돈으로 대역폭은 살 수 있지만 지연시간은 결코 살 수 없었다.”

 <그림>은 CPU와 메모리, 스토리지 사이의 불균형을 실감 있게 보여주는 자료다. 그림에서 보듯이 초당 1만번 회전하는 HDD 8대를 병렬 구성을 하더라도 오늘날의 보편적인 멀티 코어, 멀티 소켓 CPU를 사용한 서버에 비해 스토리지는 IOPS(초당입출력처리) 기준 500배 이상 느리다. 초당 1만5000회전하는 HDD를 사용하더라도 260배 느리다.

 이러한 HDD의 한계를 깨Em린 혁신적인 스토리지가 바로 SSD(Solid State Disk, SNIA는 SSS라고 부른다)이다. 반도체를 이용한 디스크라는 뜻이다. 메모리로 만든 디스크로 이해하면 쉽다. HDD의 약점인 기계적 회전이 배제됨으로 해서 낮은 지연시간, 저전력, 저소음, 긴 수명(HDD의 2배)의 고성능 스토리지가 가능해졌다.

 요즈음 누구나 가지고 다니는 USB 메모리 역시 SSD의 일종이다. 엔터프라이즈급 SSD는 메모리를 부품으로 하여 컨트롤러 기술을 비롯한 고도의 디스크 기술이 접목된 첨단 장치이다.

 SSD에 대해서 시장에 가장 많이 회자되고 있는 잘못된 미신의 하나가 ‘너무 비싸다’는 것이다. GB당 가격을 따지면 사실상 제품 종류와 성능에 따라 HDD에 비해 수 배에서 수십 배 비싸다.

 그러나 이는 산골 임야의 평당 가격과 도심의 평당 가격을 단순 비교하는 것과 마찬가지이다. 대형 유통사업을 하려는 사람에게 있어서 산골 임야의 평당 가격과 도심 평당 가격의 비교가 무슨 의미가 있는가? 그는 이 도심의 땅을 사서 사업을 할 경우 얼마나 수익이 있을 것인가를 계산하기만 하면 된다.

 여러 곳에서 SSD에 대한 설명을 하다 보면 두 종류의 반응을 접하게 된다. GB당 가격이 너무 비싼다는 반응과 20만 IOPS가 가능하다는 사실에 놀라면서 실제 테스트를 해보자는 반응이 그것이다.

 스토리지의 입출력 병목이 없다고 가정하고 여러분의 비즈니스를 다시 한번 살펴 보고 분석해 보라. 틀림없이 현재의 비즈니스 상황을 뛰어 넘는 새로운 영역을 발견할 수 있을 것이다. 실버톤컨설팅의 조사에 의하면 MS 익스체인지서버에서 애플리케이션이 6.2 IOPS/GB 이상을 필요로 하는 경우 HDD보다는 플래시 SSD를 구매하는 것이 더 저렴하며 복수의 익스체인서서버를 구성한 곳에서는 거의 대부분이 6.2IOPS/GB 이상의 성능을 필요로 한다고 한다.

 SNIA(스토리지네트워킹산업협회)에서 SSD 투자에 대한 ROI를 평가하는 간단한 공식을 내놓았다.

 ROI=(B*P)/C로 여기서 B는 애플리케이션이 가져다 주는 이익, P는 성능의 증가, C는 SSD의 비용이다. 즉 애플리케이션이 주는 이익과 성능의 곱을 비용으로 나눈 값이 ROI다. 여기에서 분모인 비용 C에만 주목하는 사람이 있다. C가 커짐으로 해서 낮아지는 ROI를 걱정하는 것이다. 반면 성능의 증가 P와 애플리케이션에서 얻을 수 있는 이점 B의 곱은 기하급수적 증가이며 C는 산술적 증가에 불과하다는 것을 잘 알고 있는 사람들도 있다.

 대부분의 기업들은 1000개, 그게 아니라면 적어도 100개의 애플리케이션을 가지고 있다. 그러나 혹자는 이 모든 애플리케이션들이 SSD의 높은 IOPS를 필요로 하지는 않을 것이라 말할 것이다. 맞는 말이다. 굳이 유용한 분야를 예로 든다면 낮은 지연시간과 높은 성능, 효율적 공간·전력을 필요로 하는 포털, 효율적 공간·전력과 짧은 지연시간을 요하는 금융, 긴 수명과 고성능을 요하는 텔코 등에 특히 효과적으로 보인다.

 플래시 SSD의 효과적인 애플리케이션으로는 테라바이트 이상의 대용량 데이터가 필요하면서도 시급한 파일을 분리해 내기가 어렵고, 읽기 치중인 데이터하우스, 작은 블록의 랜덤 IO와 읽기 위주의 작업, 그리고 시급한 파일을 분리하기 힘든 렌더링 작업, VOD, 수치해석이나 모델링 같은 대규모 데이터 처리 등에 효과적일 것이다.

 D램 SSD는 OLTP, 웹 트랜잭션 DB, 지연시간에 극히 민감한 금융 애플리케이션, 미션 크리티컬 데이타웨어하우징에 최적이 될 것이다. 그래도 못미더운 분들을 위해 피부에 와 닿을 수 있는 두 가지 사례를 소개한다.

 온라인 포도주 소매업인 와잇닷컴(wine.com)의 경우 트랜잭션 처리와 데이터 마이닝 시스템을 100% 풀가동하고 있다. 그럼에도 불구하고 이 회사는 성탄절을 전후한 연말에 쏟아지는 선물용 구매 고객을 더 이상 처리하지 못해 매번 4분기 비즈니스 기회를 잃고 있었다. 이 회사는 HDD를 SSD로 교체했다. 결과적으로 50% 운영비를 절감하고 33%의 공간을 줄였다. 읽기 지연시간을 4ms에서 1ms 이하로 줄임으로써 12배의 성능 향상을 가져왔고, 쓰기 지연시간을 12ms에서 1ms 이하로 줄여 14배의 성능 향상을 가져와 향후 24개월의 성장에 대비할 수 있는 충분한 역량을 확보했다.

 이메일 보안 회사인 클라우드마크사는 전 세계적으로 8억5000만개의 메일함을 보호하는 사업을 하고 있다. 100개 이상의 서비스업체를 고객으로 보유하고 있는데 주로 아침에 몰리는 트랜잭션의 빠른 처리가 관건이었다. 이 회사는 하위 클러스터와 수명이 다한 스토리지를 SSD로 교체함으로써 공간을 4분의 1로 줄였고, 200만달러의 비용을 절감했으며, 10배의 성능 증가를 이뤘다.

 피크시에도 가용한 15%의 IOPS만을 현재 사용하고 있어 지금의 하드웨어로 향후 1년의 성장을 확보하게 됐다. “우리는 디스크 I/O의 병목 문제가 CPU의 병목문제로 바뀌리라곤 꿈에도 생각해 본 적이 없었다” 운영임원인 라이언 화이트의 말이다.

 

 

박서기기자 skpark@etnews.co.kr


브랜드 뉴스룸