[KAIST, 빅데이터로 여는 4차 산업혁명]<하>에피지놈 빅데이터 수립으로 질병발병 이유 추적

KAIST는 유전체 정보 파악을 고도화하고 더욱 세밀한 관련 빅데이터를 수립·활용하는 연구를 진행하고 있다. 이전에는 알 수 없었던 유전체 발현 정보를 탐구, 사람마다 차이를 보이는 유전체 발현 미스터리를 풀 단초를 마련하는 연구다.

정인경 생명과학과 교수 연구팀은 질병 연구에 활용할 에피지놈(후성유전학) 빅데이터를 구축하고 있다. 사람은 모두 같은 DNA를 가지고 있지만 여러 가지 요인으로 DNA 서열과 유전자 발현 여부가 달라진다. 에피지놈은 이런 변화를 탐구하는 분야다.

Photo Image
정인경 생명과학과 교수

에피지놈 연구는 질병의 원인을 파악하는 데 필수 요소다. 질병이 발병할 유전요소를 가진 사람 가운데 어떤 사람은 실제로 병에 걸리지만 끝내 발병하지 않는 이유를 파악할 수 있게 돕는다.

파급 효과는 크지만 최근까지 연구에 난항을 겪었다. 기존 지놈 연구는 단 한번 DNA시퀀스 정보를 산출하면 마칠 수 있다. 그러나 에피지놈 연구는 한 번으로 끝나지 않는다. 현재 나온 것만 100개가 넘는 세포 타입(같은 기능을 하는 세포의 집합)에서 모두 DNA를 추출해 시퀀스 정보를 뽑아야 한다.

한 번 시퀀싱으로 나오는 데이터량도 훨씬 크다. DNA의 3차 구조(DNA가 여러 겹 접혀 있는 입체구조) 모습을 파악해야 하기 때문이다. 기존 지놈 시퀀싱에 90기가바이트(GB) 정도 데이터가 산출되는 반면에 에피지놈 연구는 하나의 셀타입을 보는 것에만 900GB가 넘는 데이터가 나온다. 미국이나 유럽과 같은 선진국에서 에피지놈 연구에 도전하고 있지만 아직 큰 성과를 거두지 못하고 있다.

연구팀은 현재 200개가 넘는 에피지놈 관련 셀 샘플을 구축하고 50테라바이트(TB)에 달하는 빅데이터를 구축했다. 대장암, 알츠하이머, 파킨슨씨병에 대한 레퍼런스 에피지놈 맵도 만들고 있다. 알츠하이머 및 파킨슨씨병은 이미 맵 해석에 돌입했다.

연구팀은 에피지놈 맵과 기존 지놈 시퀀싱 데이터를 함께 활용하면 DNA 변이 여부에 따른 발병 가능성을 예측할 수 있다고 설명했다. 그동안 정확한 발병 이유를 알 수 없었던 난치병을 아는 주요 기반으로 쓸 수 있다.

앞으로는 DNA 기반 바이오마커를 개발하는 연구도 진행할 계획이다.

정인경 교수는 “앞으로 3~4년이면 알츠하이머와 파킨슨씨병을 파악하는 에피지놈 맵 해석을 마칠 수 있을 것”이라면서 “지금은 시작단계지만 곧 방대한 에피지놈 빅데이터로 여러 가지 병의 발병을 미리 예측하는 기반을 마련할 수 있을 것”이라고 말했다.

대전=김영준기자 kyj85@etnews.com