[열린마당]시맨틱 웹으로 진화하는 웹

Photo Image

이달 초 아일랜드 골웨이에서 열렸던 ‘국제시맨틱웹콘퍼런스(ISWC 2005)’에 다녀왔다. 이번 행사에는 웹 창시자인 팀 버너스리경을 포함, 석학과 전문가 600여명이 참석해 온톨로지(ontology) 등 시맨틱 웹 기술에 관한 다양한 논문을 발표했다.

 지난 2002년 미국 플로리다에서 열렸던 행사에도 참석한 적이 있는 나는 이번 행사가 2년 전에 비해 규모, 논문의 질, 참가자 수 면에서 상당히 발전했다고 생각한다. 국내 참가자도 30여명에 달해 시맨틱 웹 관련 전문가가 증가하고 있다는 것도 확인했다. 더욱 놀라운 사실은 아직은 태동 단계인 우리나라가 중국과 경합해 ‘ISWC 2007’ 개최권을 획득했다는 것이다. 버너스리경이 매년 이 행사에 참가하고 있어 그가 2007년 11월께 행사가 열리는 제주를 방문할 가능성이 높아졌다.

 시맨틱 웹은 현재의 보여주는(display) 방식인 HTML 언어의 한계를 해결하기 위해 고안된 XML언어 기반의 차세대 웹이다. 지금까지 웹 정보가 사람을 위한 것이었다면 시맨틱 웹 정보는 기계를 위한 정보로 변해야 한다. 즉 웹에서 폭증하는 정보를 이제 더는 사람이 처리할 수 없기 때문에 컴퓨터(기계 또는 에이전트)에 의미를 이해할 수 있는 기능을 부여하여 자동화하자는 것이다. 시맨틱 웹을 가능하게 하는 기술로서 온톨로지와 온톨로지 표현언어(ontology representing language)가 있다.

 온톨로지는 특정 분야에서 서로 달리 사용하는 정보 간 의미적 상호 운용성을 극대화하기 위한 용어·개체·개념 등의 표준화, 이들 간 의미적 관계, 사용규칙 및 제한점 등을 정의한 개체·개념의 집합이라 할 수 있다. 온톨로지 표현언어는 의미적 관계로 표현된 용어·개체 등의 집합을 모델링해 기계가 이해할 수 있도록 표현해 주는 도구다. ISO 표준인 토픽 맵과 W3C 표준인 RDF·RDF(S)·OWL 등이 있다. 현재는 W3C 표준 중심으로 활발한 연구와 시장이 형성되고 있다. 그러나 이 두 표준은 경쟁 관계라기보다는 상호보완 관계로 보는 게 적절할 것 같다.

 버너스리경이 2000년대 초 미래의 웹을 시맨틱 웹으로 제안한 이래 W3C를 중심으로 관련 표준들을 개발하고 있으며, 2010년께 시장 규모가 400억∼600억달러에 달할 것으로 예측된다.

 시맨틱 웹의 응용 분야는 매우 다양하다. 이질적이고 분산돼 있는 정보들을 통합해야 하는 응용분야, 예를 들어 기업의 EAI나 EII·포털의 정보 통합, 전자정부, 전자상거래 등 모든 분야에 활용되고 있다. 대표적인 사례로 미국의 전자정부와 NASA·보잉 등이 정보인프라를 시맨틱 웹 기반으로 전환하였고 독일 특허청, 핀란드의 전자정부와 박물관, 노르웨이의 과학기술정보 등도 이 대열에 합류했다.

 국내에서는 유일하게 조달청이 목록정보를 자동화하고 효율화를 도모하기 위해 국가조달 온톨로지를 개발해 일부 활용하고 있으며, 앞으로 조달청의 정보인프라를 시맨틱 웹 기반으로 전환할 예정이다.

 IT의 핵심은 정보를 어떻게 활용하느냐에 달려 있다. 인간은 데이터를 분석해 정보를 만들고, 정보의 이해를 통해 지식을 생산하게 된다. 이 과정을 자동화하기 위한 기술이 시맨틱 웹이고 온톨로지다. 이제는 인간이 매년 5엑사바이트씩 생산되는 정보를 수작업으로 처리한다는 것은 불가능하다. 앞으로 웹은 시맨틱 웹으로 진화할 것이고, 이 진화의 핵심은 온톨로지를 포함한 시맨틱 웹 기술이 담당할 것이다. 따라서 이 기술에 대한 국가의 연구 및 투자, 기업의 도구 개발 및 상업화 등을 서둘러야 한다.

 제주에서 열리는 ‘ISWC 2007’이 성공하기 위해서는 이 분야의 학계 및 업계 연구자, 관련 기업, 관련 정부부처 등의 협력이 필요하다. 나아가 이를 통해 국내의 시맨틱 웹에 대한 관심과 연구가 확산되기를 기대해 본다.

◆김성혁 숙명여대 교수  ksh@sookmyung.ac.kr 


브랜드 뉴스룸