[인지과학 패러다임] 4차산업혁명의 미래는 사람이 답이다

Photo Image
조광수 연세대 교수 & 인지융합과학기술 포럼 부의장

비 갠 오후. 카페에 앉아 있다. 옆 테이블에서 조잘대는 소리가 들린다. 초딩이거나 많이 봐야 중딩이다. 무슨 이야기가 그리 재밌는지 박장대소를 한다. 보기만 해도 미소가 나온다. 귀를 기울여 본다. 그런데 … 말은 분명 우리말인데, 무슨 말인지 모르겠다. 중요할 듯한 때가 되면 어김없이 그들만의 은어를 쓰니 어리둥절할 뿐이다. 그래도 “개좋아”는 이제 안다. 최소한 개를 좋아한다는 아니다.

인간에게 이롭고, 편리하고, 안전한 기계를 만드는 인지융합과학기술

이렇게 사람도 어려운데, 음성으로 대화를 나누는 인공지능 기계가 사람의 말을 알아듣기 위해서는 무엇이 필요할까? 사람이 타인의 말을 알아들으려면, 그 사람이 무슨 말을 하는지, 어떤 의도를 지니고, 어떤 기분인지, 어떤 맥락인지 가늠할 수 있어야 한다. 기계도 마찬가지인데, 예를 들어 간단한 말소리와 의미파악을 살펴보자. 누군가의 요청을 듣고, 듣는 이가 “네”라고 대답을 했다. 여기서 “네”는 무슨 뜻일까? 단순히 소리를 글자로 바꾸어주는 음성인식 기술을 이용한다면, “네”는 글자 그대로 동의 혹은 승인이 된다. 그런데 만약 “네”라고 할 때, 발음을 짧게 하며 억양을 살짝 높였다면, 이는 못 알아들었으니 다시 말해 달라는 의미가 된다. 그리고 “네”를 길게 발음하며 억양을 한번 낮추었다가 뒤끝에서 크게 높였다면, 이번에는 “무슨 황당한 말을 하세요”라는 의미가 된다. 물론 이렇게 억양에 따라 의미가 바뀌는 규칙이 적용되지 않을 수 있다. 서울말로 의문일 때는 말 끝의 억양을 높이지만, 경상도 어느 지역 말에선 말 끝을 내리기 때문이다. 결국 인간의 언어행동에 대한 과학적, 행동적 수준의 연구가 없다면, 인공지능 기계는 말귀 먹었다고 핀잔을 들을 것이다. 컴퓨터공학을 전공했다고, 인공지능 프로그래밍을 한다고 만들 수 있는게 아니다.

알파고로 유명한 구글의 딥마인드에서는 사람의 입모양을 읽어서 말을 알아듣는 인공지능 기술을 연구하고 있다고 한다. 사람은 말을 소리로만 알아듣는 것이 아니라, 입모양을 같이 본다는 인지심리학의 다중감각(multisensory) 연구결과에 기반한 것이다. 이런 인지융합 과학기술 덕에 앞에서 말을 할 때뿐만 아니라, 조용히 말을 하거나 멀리서 말을 하는 경우에도 잘 알아듣는 인공지능 기계를 만들 수 있게 된다.

물론 의사소통을 잘 하는 인공지능 기계가 되려면 말도 잘해야 한다. 상대방이 이해하기 쉽게 말하고, 필요하면 설득을 할 수 있어야 한다. 더군다나 사람은 말을 들으면서 남자인지 여자인지, 나이는 어느 정도인지, 지적인지, 어떤 기분인지, 매너는 있는지 등등을 판단하니, 이에 맞추어 기계도 잘 해야 한다. 이 때문에 보통 음성대화용 기계를 만드는 기업들은 자신의 브랜드를 잘 나타내는 가상의 인물 퍼소나(persona)를 만들고, 이에 맞는 성우의 목소리를 녹음해서 사용한다. 만약 심리학의 자기노출 효과를 활용하여, “나 이 노래 무척 좋아하는데…”라는 멘트를 날리며 사용자와 공감대를 형성한다면 마케팅도 잘 하는 인공지능 영업사원으로 거듭날 수 있다.

요는 이런 것이다. 인간과 기계의 관계에서, 더 좋은 기술이란 사람과 잘 상호작용하고 더 잘 의사소통하는 기술이다. 그러기 위해서는 사람의 의사소통 연구가 바탕에 있어야 한다. 이런 연구는 인지융합과학에서 하는 사람에 대한 과학적 연구이며, 이런 연구를 기반으로 탄생하는 기술이 인지융합기술이다. 즉, 사람중심의 기술이다.

예를 들어, 길을 잘 안내하는 내비게이션을 만든다고 하자. 어떻게 해야 할까? 다양한 연구개발이 필요하겠지만, 그 무엇보다 사람이 어떻게 길을 찾는 가 그리고 왜 찾는 가를 이해하는 연구가 필요하다. 즉 혁신적 상품 기획의 출발은 인간에 대한 과학적 이해이다. 인지과학의 길 찾기 연구에 의하면, 사람들은 조망지식(surveying knowledge), 경로지식(routing knowledge), 그리고 지표 지식(landmark knowledge)이라는 세가지 지식을 사용한다. 조망지식은 사람들이 “저 쪽으로 가면 돼요”하는 것처럼, 현재 위치에서 목적지까지 가는 큰 그림이다. 경로지식은 내비게이션에서 가장 자주 쓰는 것인데, “1.2 km 직진 후 우회전”같이 구체적인 길을 아는 것이다. 마지막으로, 지표 지식이란 “저기 보이는 사거리에서 우회전”이라거나 “저기 흰 건물에서 우회전”같이 중요하고 눈에 잘 보이는 지표를 이용하는 것이다. 사실 문제는 내비게이션은 사람이 쓰는 지표지식을 사용하지 않고, 사람이 쓰지 않는 절대거리를 알려준다는 점이다. 역지사지로, 당신의 상사가 길을 물었는데, “1.2 km직진하다가 우회전하세요”라고 답한다면, 상사가 어떻게 반응할까?

이런 내비게이션은 바쁜 사람을 위한 기술이다. 그런데 만약 길 자체를 즐기려는 사람을 위한 로맨틱 내비게이션을 만든다면? 이 길로 가면 어떤 낭만이 있고, 그 다음에 어디로 가면 어떤 볼거리와 먹거리가 있다고 알려주고, 어디에 가면 고백하기 좋은 곳이라는 서비스가 필요할 것이다. 그리 다르지 않은 기술이라도, 사람이 왜 길을 찾고, 어떻게 찾는지를 이해한다면 다른 서비스를 만들 수 있다.

최근 자율주행차 덕분에 일반에게 널리 알려진 에이다스(ADAS, advanced driver assistance system)도 마찬가지이다. 에이다스는 운전자의 안전을 보조하는 기술을 말하는데, 이는 인간이 가진 부족한 능력을 보완하는 기술이다. 왜냐하면 상당수의 자동차 사고는 인간의 부주의같은 제약때문에 일어나기 때문이다. 물론 정신일도 하사불성으로 전방주시하며 운전에 집중하라고 다그칠 수 있다. 하지만 아무리 주의를 줘도 졸음운전 사고는 계속 나고, 후진으로 인한 참사도 일으킨다.

Photo Image

나도 뼈아픈(?) 경험이 있다. 경부고속도로를 타고 서울로 오는데, 금요일 퇴근시간에 맞물리며 거북이 걷듯 정체였다. 액셀레이터가 전혀 필요없는 상황이었기에, 브레이크만 밟고 떼며 주행했다. 때 마침 앞 차와의 사이가 벌어지더니, 검정색 메르세데스 벤츠 S63이 들어왔다. 그 후도 여전히 브레이크 주행을 했다. 근데 아뿔싸! 앞차에 닿았다. 정말 아주 잠시 딴 생각을 했을 뿐이었다. 인간은 이렇게 반복적인 행위를 할 때 주의를 놓치게 되는 약점이 있다. 결국 앞 차 운전사에게 2억 5천만원짜리 차에 접촉사고를 냈다는 훈계를 들었고, 엄청난 금액으로 보험처리했다. 내 차가 전복을 했어도 그 정도 비용은 나오지 않을 것 같았다.

만약 내 차에도 앞 차와의 거리를 인식하며 자동으로 정지하는 에이다스 기술이 장착되어 있었다면, 그 사고를 피할 수 있었을 것이다. 에이다스 시스템은 인간의 제약된 인지역량을 연구하고, 이를 보완하는 기술이다. 이런 기술은 자동차의 비지니스 가치를 올린다. 인지융합과학이 좋은 기술을 넘어 좋은 비지니스를 위해 필수가 되는 이유이며, 사용자경험(user experience)이라거나 인간-컴퓨터 상호작용, 에이다스같은 인간-자동차 상호작용, 인간-로봇 상호작용 같은 분야로 발현된다.

인공지능의 파괴적 혁신을 위한 인지융합과학기술

인지융합과학기술은 사람과 상호작용하는 기술 혹은 사람의 취약점을 보완하는 증강인지(AI, augmented intelligence)를 넘어서서, 인공지능 기술 그 자체의 혁신과 지향의 모델이 되기도 한다. 예를 들어, 구글 딥마인드의 알파고 덕분에 전 국민에게 알려진 딥러닝은 인공신경망에서 비롯되었다. 인공신경망은 컴퓨터공학자가 아닌 신경생리학자 맥컬로와 인지심리학자 핏츠가 만든 것이다. 생물시간에 배운 것처럼, 뉴런에서는 신경전달 물질을 시냅스에 분비하며 신호를 전달한다. 이를 받은 수상돌기(dendrite)들은 전달된 신호들을 합해서 기준값(threshold)을 넘으면 활동전위(action potential)라는 전기신호를 만든다. 활동전위는 축삭돌기(axon)를 타고 이동하다가 끝에 도달하면 시냅스에서 신경물질이 분비되며 다음 뉴우론으로 신호를 전달한다. 이런 신경의 메카니즘을 인공적인 기술로 구현한 것이 인공신경망이다.

구글 딥마인드 CEO 하사비스가 컴퓨터공학박사가 아니라, 인지(신경)과학 박사로서 인간의 기억 메카니즘 같은 인지(cognition) 연구를 수행하는 점은 시사하는 바가 크다. 왜냐하면 현재 인공지능과 기계학습의 수준은 인간의 뇌와 마음에서 일어나는 정보처리에 비하면 여전히 미천하기 때문이다.

그런데 인지가 뭐길래, 인공지능을 위해 인지 연구를 하는 것일까? 이를 위해 지능과 인지(cognition)가 무엇인지 알아보자. 지능이란 IQ가 100점이니, 150점이니 하듯, 얼마나 머리가 좋은 가라는 일종의 성능(performance)을 말한다. 이는 자동차의 속력에 비유할 수 있다. 자동차가 속력을 내려면 엔진이라는 내연기관이 있어야 한다. 엔진은 연료가 들어오면, 공기와 혼합하고, 압축을 한 후, 폭발시켜서 운동에너지, 즉 동력을 만든다. 자동차 엔진처럼 인간에겐 지능을 만들어 내는 것이 인지이고, 정보를 처리하는 방식과 구조를 가지고 있다. 이를 인지 아키텍처라고 부른다. 따라서 인지과학자들은 사람의 인지 아키텍처를 연구한다. 즉 사람이 어떻게 세상을 보고, 듣고, 지각하고, 주의를 주고, 느끼고, 학습하고, 생각하고, 좋아하고, 판단하고, 행동하는지를 연구한다. 고유의 인지과학자들은 인지의 수학적 모델을 만든다. 즉 지능 개발을 위해선 인지 연구가 필수이다.

하사비스는 인공신경망이 인공지능의 시작이 된 것처럼 미래 인공지능 기술의 파괴적 혁신을 인지융합과학에서 찾는 것이다. 그도 그럴 것이 알파고가 충격적인 성능을 보였지만, 혁신의 여지는 여전히 크다. 예를 들어, 이세돌 9단이 알파고와 네 번째 대국에서 신의 한 수를 두며 승기를 잡았다. 이 수는 과거에 존재하지 않았던 수였지만, 바둑해설자들은 그 수를 보자마자 감탄사를 질렀다. 아직 인간만이 가능하다는 일명 원샷 학습이다. 널리 알려진 바와 같이 딥러닝은 막대한 양의 빅데이터가 있어야 하며, 엄청난 컴퓨팅파워도 필요하다. 이를 역으로 말하면 스몰데이터나 웬만한 컴퓨팅파워로는 잘 안 된다는 뜻이다. 그런데 사람은 가능하다. 만약 어떻게 가능할지를 안다면 혁신적인 인공지능 기술을 창출할 수 있을 것이다. 이 외에도 사람은 무슨 생각을 하고 있는지 반추(reflection)하면서 자신의 논리와 사고를 수정하는 초인지(meta-cognition) 역량을 가지고 있지만, 인공지능은 아직 할 수 없다. 이세돌은 복기를 하며 자신의 패착을 상기하며 스스로를 재정비하는 학습을 하였지만, 이 역시 기계학습에서 불가능하다. 실상 기계학습에서 말하는 학습(learning)은 데이터를 모아서 한 번에 진행하는 방식이지, 실시간으로 일어나는 학습이 아니다. 더군다나 추가적인 학습을 한다고 나아진다는 보장도 없다.

Photo Image

자율주행차에 적용되는 컴퓨터 시각분야에서 인지융합과학기술의 역할이 더욱 분명해진다. 전통적인 컴퓨터 시각 연구자들은 카메라로 인식하는 모든 정보를 처리하려고 하였다. 그런데 근래에는 인간의 주의(attention) 기제를 적용해서, 주요 사물이나 특징에만 주의 초점을 두어 처리하는 알고리즘에 열을 올리고 있다. 왜냐하면 자동차로 달리면서, 카메라로 보이는 모든 것을 모두 인식하고 처리하겠다는 것은 매우 비효율적이면서, 정보가 역시 떨어지는 방식이기 때문이다. 마치 책을 읽으며 모든 문장에 줄 치는 것과 별 반 다르지 않다.

인공지능의 한계는 마음의 문제에만 국한되지 않는다. 인간의 인지는 하드웨어인 몸도 잘 운영하지만, 지금의 인공지능은 그러지 못한다. 2016년에 있었던 미국 다르파(DARPA, 방위고등연구계획국) 챌린지에서 보았듯이, 세계 최고의 로봇들은 여전히 제대로 걷지도 못하고, 문을 열다가 넘어지기 일쑤이다. 그런데 일본의 토요타에서 인수한 보스톤 다이나믹스의 빅도그(Big dog) 로봇은 넘어지지 않는다. 사실 빅도그 기술의 핵심역량은 사족 동물의 다리움직임 연구이다. 로봇공학보다 다리 연구에 더 많은 기간과 투자가 이루어지지 않았다면, 넘어지지 않는 빅도그는 로봇공학에서 나오지 못했을 것이다.

얼마 전, 인공지능과 기계학습을 선도하는 미국과 우리나라 기술차이는 불과 몇 년 정도이니 빨리 따라잡아야 한다는 주장이 있었다. 과연 그럴까? 물론 빠른 추격자(fast follower)적 사고에선 현존 인공지능 기술을 단시간 내에 따라 잡을 수 있을 것이라고 볼 수 있다. 하지만 다음 세대의 인공지능 패러다임을 선도하는 혁신적인 인공지능연구가 가능할까? 시장 선도자(first mover)가 되려고 한다면 인지융합 연구에 초점을 두어야 한다고 감히 주장한다.

크로스 도메인의 수평적 융합 플랫폼

마지막으로, 4차산업혁명의 서막에서 인지융합 과학기술이 추구하는 제 분야간 수평적 융합 플랫폼으로서의 역할을 살펴보자.

이를 위해 전통적인 가스경보기를 생각해 보자. 가스경보기는 누출된 가스를 탐지하면 요란한 알람 소리를 내는 기계이다. 그래서 우수한 가스탐지기를 만들려면, 미세한 가스도 놓치지 않는 센서의 성능, 오래 지속되는 배터리, 충분히 큰 소리로 알릴 수 있는 알람 벨의 성능, 인테리어에 잘 어울리는 멋진 디자인이 중요하다. 그렇지만 아무리 우수한 가스경보기를 만들어도, 사람이 원하는 안전을 보장하지 못한다. 왜냐하면, 가스 경보가 울리면, 안전을 위해서는 가스밸브를 잠그고, 누전 사고를 막기 위해 전기를 내려야 하고, 창문을 열어 환기를 시켜야 한다. 만약 침대에서 잠든 가족이 있다면 흔들어 깨워야 하고, 119에 신고도 해야 한다. 즉 사람의 관점에서 혹은 사용자경험의 관점에서 우수한 가스경보기는 재정의되어야 한다. 새로운 가스경보기는 제조와 전기, 통신 뿐만 아니라, 스마트 창문을 만드는 건축이나, 스마트 침대 같은 가구 인테리어, 그리고 디자인이 배타적인 개별 분야를 넘어 사람을 중심으로 융합하여야 한다. 이게 혁신적인 기술이고, 고객중심의 비지니스가 된다.

Photo Image

사람중심의 가스경보기의 경우처럼, 인지융합과학기술은 크로스 도메인의 수평적 융합으로서 그 정점에는 ‘인간’을 둔다. 인지과학은 본래 과학사 최초의 융합분야로서 인간의 본질인 마음의 원리를 과학적으로 연구한다. 즉 인간이란 공통분모를 가지고 전통적으로 인지심리학, 철학, 컴퓨터공학, 인공지능, 신경과학, 언어학, 인류학이 인지과학을 구성하는 핵심학문으로 언급되고 있으며, 최근에는 로봇학, 교육학, 경제학, 미학, 디자인, 법학, 건축, 생물학 등으로 확장되어 가고 있다.

융합 플래폼적 역할 덕분에, 인지과학은 최근 로봇과 인공지능의 혁신을 주도하고 있다. 대표적인 이론이 체화된 인지(embodied cognition)이다. 이를테면 지능은 마음이 아닌 몸에서 시작된다는 입장이다. 사실 과거에는 몸과 마음을 분리해서 바라보던 이원론적 입장이었다. 그래서 몸을 다루는 생물학과 마음을 다루는 심리학이 구분되었고, 기계과는 하드웨어를 다루고, 전산과는 소프트웨어를 다루게 되었다. 결국 인공지능은 마음의 이슈이고, 몸을 다루지 않았다. 하지만 몸과 마음을 통합적으로 바라보던 철학에서부터 체화된 인지에 관한 논의가 무르익더니, 심리학은 이를 과학의 반열에 올렸다. 덕분에 인지과학은 인공지능과 로봇을 통합하는 기술의 배경이 되었다. 체화된 인지는 심지어 마케팅에서 인기절정의 체험마케팅으로 발현되었다.

4차 산업혁명 시대에 진입하며, 사물인터넷, 로봇, 인공지능 등의 놀라운 2세대기계가 급부상하고, 이제 미래는 한 치 앞이 보이지 않는다. 인지융합과학기술은 그 미래를 ‘사람’에게서 찾는다. 기계를 위한 기술이 아닌, 인간을 위한 기술을 위해서다.

결국 사람이 답이다.

조광수 연세대 교수 & 인지융합과학기술 포럼 부의장


브랜드 뉴스룸