슈퍼컴퓨터가 생명의 신비를 찾는다

슈퍼컴퓨터가 세계에서 가장 어려운 퍼즐 게임을 풀기 시작한다. 그 퍼즐 게임은 생명의 기본 정보를 담고 있는 유전자(DNA)를 해독하는 게놈 프로젝트. 지난 6월 26일 인류의 달 착륙보다 큰 의미를 갖고 있다고 평가되는 유전자 지도의 정체가 세계 공동연구팀에 의해 최초로 공개됐지만 아직 그 성과는 걸음마 단계다.

인간의 유전자에 집적돼 있는 정보를 데이터베이스로 만드는 것은 매우 방대한 계산 작업이다. 그 이유는 인간에게 나타나는 하나의 생물학적 증상이 하나의 유전자뿐 아니라 복수의 유전자에 의해 일어나는 경우가 많기 때문이다. 예를 들어 유방암은 하나의 유전자에 결함이 생겨 나타나는 것이 아니라 여러 유전자의 조합 과정에서 발생한 이상 때문에 발병한다.

현재까지 확인된 인간의 유전자는 약 3만5000개로 이 유전자가 담고 있는 정보와 그 유전자간의 조합으로 인해 일어나는 각종 경우의 수를 계산하는 것은 엄청난 작업이다. 과학자들은 『유전자 분석 작업, 그 중에서도 유전자간의 조합에 따른 상관관계를 밝혀내는 것은 마치 모래사장에서 바늘을 찾는 것보다 힘든 작업이며 수많은 시행착오를 거쳐야 한다』고 한다. 이를 증명이라도 하듯이 최신 슈퍼컴퓨터로 1단계 유전자 분석을 하는 데 약 447년이 걸릴 것이라고 한다. 그렇다면 유전자의 비밀을 밝혀 인류의 질병 치료에 획기적인 전기를 마련하려면 반세기를 기다려야 할까. 물론 그렇지 않다. 새로운 방식으로 구성한 슈퍼컴퓨터가 그 해답을 쥐고 있다.

미국 굴지의 바이오 기업인 뉴텍사이언스는 최근 유전자 분석용 소프트웨어를 개발, 이 소프트웨어를 사용해 유전자 분석을 1개월 안에 완료할 수 있을 것이라고 밝혔다. 여기에 사용되는 하드웨어는 병렬 방식으로 만든 IBM의 슈퍼컴퓨터. 이 슈퍼컴퓨터는 97년 세계 체스 챔피언인 게리 카스파로프를 이긴 딥블루보다 600배 이상 빠른 것으로 초당 7조5000억회의 연산이 가능하다.

이 병렬 방식의 슈퍼컴퓨터는 1250대의 서버를 병렬로 연결해 구성한 클러스터링 서버로 2.5테라바이트(TB)의 메모리에 50TB의 스토리지를 갖추고 있는 셈이다. 컴퓨터 간의 연결은 모두 인터넷을 통해 이뤄지며 하나의 연산 작업을 분산해서 작업하고 그 결과를 모으는 형태를 갖기 때문에 매우 빠른 연산 처리가 가능하다.

이러한 클러스터링 방식 슈퍼컴퓨터는 네트워크 성능의 발달로 비약적인 발전을 거듭했다. 이번에 뉴텍사이언스가 구성하는 클러스터링 슈퍼컴퓨터뿐 아니라 많은 클러스터링 슈퍼컴퓨터가 만들어져 생명공학이나 우주과학 등에 사용되고 있다. 대표적인 예로 미국 정부가 로렌스리버무어 연구소에 만든 아스키화이트(ASCI White)가 있는데 이 슈퍼컴퓨터는 현존하는 세계 최고속 슈퍼컴퓨터로 꼽히고 있다.

유전자 분석은 각 유전자들의 상관관계가 복잡하게 얽혀있어 연산의 시행착오가 무수히 반복된다. 따라서 이렇듯 엄청난 성능의 컴퓨터를 동원해서도 1개월 정도의 시간이 필요한 것이다. 더욱이 이 기간에 밝혀내는 것은 유전자 분석의 기초 작업에 지나지 않는 것으로 유전자의 비밀을 완전히 푸는 데는 좀 더 시간이 걸릴 전망이다.

또 뉴텍사이언스는 이 분석 작업에 다른 생명공학 기업이나 제약 회사가 보유하고 있는 슈퍼컴퓨터를 임대해 활용할 계획이다. 따라서 클러스터링 슈퍼컴퓨터에 연결되는 다른 회사의 슈퍼컴퓨터가 생기는 것이다. 또 뉴텍사이언스는 지금까지 구축한 클러스터링 슈퍼컴퓨팅의 노하우를 다른 생명공학 기업에 제공, 앞으로 유전자 분석 프로젝트에 동참하는 하나의 커뮤니티로 발전시킨다는 청사진을 갖고 있다.

<장동준기자 djjang@etnews.co.kr>


브랜드 뉴스룸