[ET단상]심층학습과 인지 컴퓨팅의 미래

Photo Image

2012년 구글과 스탠퍼드대 연구팀이 1000대의 컴퓨터를 연결해 임의의 사진으로부터 스스로 시각적인 개념을 학습하는 심층학습 기반 인공 신경망을 발표했다. 지난해엔 수많은 심층학습 스타트업과 인재가 구글과 페이스북과 같은 IT 대기업에 인수됐다. 올해는 페이스북에서 심층학습을 이용해 사람과 동등한 수준의 정확도를 보이는 얼굴 인식 기술을 선보였다.

심층학습이 주목 받는 것은 현재까지 인공지능이 가졌던 인식 성능을 획기적으로 개선해 신규 시장을 만들어낼 수 있는 가능성 때문이다. 인공지능은 사람의 인지능력으로만 할 수 있었던 일을 자동화해 노력과 비용을 줄여줄 수 있다는 점에서 오래전부터 개발돼 왔다. 하지만 정확도나 처리속도의 제약으로 적용되고 있는 분야가 제한됐다. 하지만 2000년대 후반부터 학계에서 심층학습이 이러한 한계를 개선할 수 있다는 근거들이 발표되고 산업계가 적극 수용하면서 다시금 인공지능 관련 시장이 커지고 있다.

아이러니하게도 심층학습은 구현적인 측면에서는 크게 새로운 것이 아니다. 기본적인 구조는 1970년대부터 연구돼온 인공신경망을 여러 층으로 확장한 형태다. 학습을 진행하는 알고리즘 역시 과거의 단순한 기법을 거의 그대로 사용한다. 달라진 것이 있다면 데이터의 양과 컴퓨터의 성능 그리고 그동안 축적돼온 수많은 연구자들의 실험 결과들이다.

풍부한 데이터는 심층학습에서 가장 중요한 요소다. 사람과 컴퓨터를 막론하고 어떤 것을 학습시키기 위해 막대한 양의 데이터가 필요하기 때문이다. 인터넷 발달로 데이터를 손쉽게 수집할 수 있었던 것은 심층학습이 작동할 수 있었던 가장 큰 이유다. 컴퓨터의 연산 성능 향상 역시 중요하다. 심층학습은 수많은 데이터를 통해 현재의 인지모델에 대한 가설을 검증하고 개선해 나가는 과정의 반복이므로 엄청난 양의 계산이 필요하다. 특히 2007년 GPU를 병렬계산에 활용하는 기법이 대중화되면서 대규모 인공지능 연구에 큰 도움을 줬다.

하지만 아무리 데이터가 많고 컴퓨터가 빨라져도 이를 잘 활용할 수 있는 이론적·경험적 지식이 없이는 제대로 작동하는 인공지능을 만들어낼 수 없다. 특히 큰 규모의 인공신경망은 이론적 분석에 한계가 있다. 데이터의 종류에도 큰 영향을 받기 때문에 다양한 실험과 체계적인 분석도 중요하다. 수많은 시도와 실패 속에서 살아남은 기법과 수치들이 현재의 심층학습 구조를 만들어 냈다.

심층학습은 이제 그 가능성의 일부를 드러냈을 뿐 앞으로 펼쳐질 가능성이 무궁무진하다. 어떤 데이터를 이용해 학습시키는지에 따라 그에 최적화된 인공지능을 만들어 낼 수 있기 때문이다. 예를 들면 대량의 얼굴 데이터를 활용한 얼굴 인식기를 보안 분야에 활용하는 식이다. 같은 방식으로 음식 인식기를 만들어 다이어트 서비스에 적용하는 것도 가능하다. 더 나아가 텍스트, 금융, 네트워크 트래픽, 음악 등 구조적 패턴을 가진 모든 형태의 데이터에 심층학습을 적용할 수 있다.

머지않아 컴퓨터가 그동안 상상하지 못했던 수준으로 정보를 인식하는 세상이 올 것이다. 마치 개인 비서를 둔 것처럼 대량의 정보를 요약하고 컴퓨터에 개인 사진을 정리하거나 어제 잡지에서 본 상품을 찾아달라는 등의 일을 맡기는 것이 자연스러운 일이 될 것이다. 차세대 컴퓨팅 패러다임으로 불리는 인지 컴퓨팅 기술에 대한 학계와 산업계의 꾸준한 노력과 투자를 기대한다.

백승욱 클디 대표 swpaek@cldi.io


브랜드 뉴스룸