[KISTI 과학향기]DNA로 정보를 저장하는 시대 올까

살아 있는 대장균 DNA에 이미지와 동영상을 저장하고 재생하는 데 성공한 연구가 화제를 모으고 있다. 미국 하버드대 의대 조지 처치 교수 연구진은 대장균 유전체에 손 사진과 사람이 말을 타고 달리는 동영상 파일을 저장해 읽어내는 데 성공했다. 연구 내용은 지난달 13일 국제학술지 '네이처(Nature)'에 게재됐다.

Photo Image

컴퓨터가 0, 1(이진법)을 이용해 정보를 저장하듯 DNA는 A, T, C, G 4가지 염기로 정보를 간직한다. 실제 DNA는 이론적으로 1g에 약 10억GB의 데이터를 저장할 수 있고 안정적으로 수십 만년 동안 보존할 수 있는 것으로 알려졌다.

연구진은 이미지를 이루는 각 점(픽셀)의 위치와 명암 정보를 숫자로 이뤄진 바코드로 만들었다. 이후 DNA를 이루는 염기 A(아데닌)는 1·0, T(티민)는 0·1, C(시토신)는 0·0, G(구아닌)는 1·1로 치환해 이미지 정보가 담긴 합성 DNA 조각을 만들었다. 예를 들어 바코드가 111101이면 이를 GGT로 변환한 것이다.

연구진이 사용한 이미지는 가로, 세로가 56픽셀인 흑백의 손바닥이다. 연구진은 각 픽셀의 색과 위치 정보를 4가지 염기로 치환한 뒤 세균 면역체계의 일부인 크리스퍼(CRISPR)를 이용해 사진 정보를 담은 합성 DNA를 대장균에 넣었다. 일주일 뒤 연구진은 분열해 증식한 대장균을 모아 DNA 염기 서열을 차세대 시퀀싱 기법으로 해독했다. 그 결과 원본과 똑같은 손바닥 이미지를 얻을 수 있었다.

Photo Image
연구진은 말이 질주하는 장면을 연속 촬영한 사진을 대장균의 DNA에 저장한 뒤 빠르게 재생해 동영상으로 만드는데 성공했다. 출처 : Havard medical school

동영상 저장에도 성공했다. 연구진은 영국 사진작가 이디워어드 마이브리지의 '인간과 동물의 운동'이라는 작품의 사진을 활용했다. 이 사진은 1887년 '애니 G.'라는 암말이 질주하는 장면을 연속해 촬영한 사진이다. 연구진은 애니메이션처럼 연속된 사진을 빠르게 재생해 동영상으로 만드는 원리를 이용했다.

연구진은 손바닥 이미지를 저장할 때와 같은 방법으로 연속된 사진 다섯 장의 위치와 명암 정보를 A, T, C, G 4가지 염기로 변환한 뒤 5일 동안 하루에 한 프레임씩 대장균에 넣었다. 각 프레임의 정보는 넣은 순서대로 대장균의 크리스퍼(CRISPR) 영역에 순서대로 삽입됐다. 이후 연구진은 대장균의 크리스퍼 영역을 시퀀싱으로 해독해 90% 정확도로 재생하는 데 성공했다.

연구진은 이번 연구가 살아 있는 생물에도 정보를 기록하고 보관할 수 있다는 걸 보여줬다며 대장균 이외 다른 생물의 세포를 이용한 정보 저장 장치도 만들 계획이라고 밝혔다.

대장균이 합성 DNA를 받아들일 수 있었던 비결은 세균의 면역시스템에 있다. 세균은 바이러스가 침입할 때 바이러스의 DNA 일부를 염색체 내 '크리스퍼'라는 곳으로 끌어오는데, 대장균도 외부 DNA가 들어오자 크리스퍼 영역에 저장한 것이다. 크리스퍼(CRISPR)는 세균에 존재하는 반복된 염기서열을 의미하며 영문 뜻 자체도 '주기적 간격으로 분포하는 짧은 회문구조 반복 서열(Clusters of Regularly Interspaced Palindromic Repeats)'의 약자다. 이는 DNA의 염기서열이 역순으로 배치되는 구조로 앞으로 읽으나 뒤로 읽으나 염기 배열이 같다.

Photo Image
디지털 정보를 고분자 물질인 합성DNA 안의 염기서열 정보로 저장할 수 있다. 출처 : shutterstock

크리스퍼는 1987년 일본 오사카대 소우 이시노 박사팀이 대장균의 단백질 유전자를 연구하던 중 발견했다. 이후 덴마크의 요구르트 회사인 '다니스코' 연구자들이 크리스퍼의 역할을 찾아냈다. 연구자들은 바이러스로 유산균이 떼죽음을 당했을 때 살아남은 일부 유산균의 DNA를 분석했다. 그 결과 살아남은 유산균은 내성을 갖고 있었으며 회문구조(21개)에서 바이러스 DNA를 발견했다. 이 유전자를 없애자 내성이 사라졌고 연구자들은 이를 통해 크리스퍼가 면역체계에 관여한다는 사실을 알아냈다.

세균은 바이러스가 침입하면 바이러스의 DNA 일부를 염색체 내 크리스퍼 영역으로 옮긴 뒤 가이드 RNA(gRNA)로 전사된다. gRNA는 바이러스의 DNA를 찾는 길잡이 역할을 하는데, 가위 역할을 하는 단백질 Cas9와 결합해 외부에서 침투한 바이러스의 DNA를 찾아 잘라낸다. 이때 단백질 Cas9에 결합하는 RNA를 바꾸면 다른 DNA 서열도 자를 수 있다는 것이 밝혀졌다. 이것이 바로 3세대 유전자가위로 주목받고 있는 크리스퍼 유전자가위(gRNA, 크리스퍼, Cas9로 구성)다.

한편 디지털 정보와 염기 정보를 바꿔 DNA를 대용량의 저장정보로 사용할 수 있다는 사실은 다른 연구성과에서도 확인할 수 있다. 2013년 유럽생물정보학연구소(EBI) 연구진은 '네이처'에 발표한 논문을 통해 757KB(킬로바이트) 규모의 디지털정보를 DNA에 저장했다가 그대로 복원하는데 성공했다고 밝힌 바 있으며, 지난 3월에는 미국 컬럼비아대 등 연구진이 1g의 DNA에 215PB(페타바이트)의 막대한 정보를 담을 만한 집적도를 구현하는 기술을 개발했다. 정보가 급증하고 있는 시대에 미래 저장매체로써 DNA 활약이 기대된다.

글:이화영 칼럼니스트


브랜드 뉴스룸