세계 최대 지식 창고 '위키백과', AI 거짓 정보로 오염 우려

Photo Image
위키백과 로고. [사진=위키백과]

세계 최대 지식 창고로 불리는 웹사이트 '위키백과'가 인공지능(AI)이 생성한 거짓 정보로 오염되고 있다는 우려가 나왔다.

논문 사전 공개 사이트 '아카이브(arXiv)'에 최근 게재된 '위키백과에서의 AI 생성 콘텐츠의 부상' 논문에 따르면, 지난 8월 위키백과에 생성된 영어 문서 2909개 중 145개(약 5%)가 AI 생성 콘텐츠인 것으로 나타났다.

논문 연구진에 따르면, AI 생성 콘텐츠 중 일부는 '광고', '역사 왜곡', '정치적 양극화' 등 악의적 목적성을 띠고 있었다.

Photo Image
연구진이 위키백과 문서 중 AI 생성 콘텐츠로 분류한 '디브라의 반란(Uprising in DIbra(1920)' 문서. 이 문서는 거짓으로 드러나 위키피디아 관리자에 의해 삭제됐다. [사진=위키백과에서의 AI 생성 콘텐츠의 부상(The Rise of AI-Generated Content in Wikipedia)]

예컨대 연구진이 AI 생성 콘텐츠로 분류한 문서 중 1920년 알바니아 디브라 지역에서 일어난 '디브라의 반란(Uprising in DIbra, 1920)'은 거짓으로 드러났다. 이 문서는 위키백과 관리자에 의해 삭제됐다.

연구진은 “AI로 생성한 콘텐츠 자체는 문제가 아니다. AI는 문서 요약·번역 등 보조 도구로 유용하게 쓰인다”면서도 “다만, AI의 발전으로 거짓 콘텐츠를 대량으로 생성하는 것이 점점 쉬워지면서 사람들이 진실을 혼동할 수 있다”고 우려했다.

위키백과 문서 신뢰성이 위협받는다고 느낀 위키백과 관리자들은 지난해 말 '위키프로젝트 AI 클린업'을 결성했다.

이는 위키백과에서 출처가 없고 잘못 작성된 AI 생성 콘텐츠 증가 문제를 해결하기 위한 모임이다. 현재 75명이 이 모임에 참여해 위키백과 콘텐츠의 AI 생성 여부를 직접 파악하고 있다.

그러나 개개인이 AI 생성 콘텐츠를 탐지하는 데에는 한계가 있다는 지적도 나온다.

모임 창립자인 퀸 오브 하츠는 404미디어에 “위키백과 사용자가 AI 콘텐츠를 잘 감지한다고 생각하고 싶지만, 그렇지 않은 게 현실”이라며 “AI 생성 텍스트 여부를 완벽하게 구별할 수 있는 탐지 도구는 없다”고 터놓았다.

그는 이어 “주요 기업들이 AI가 생성한 허위 정보를 감지하고 제거하지 못하는 것은 우려스럽지만, 자원을 적절히 투자한다면 충분히 해낼 수 있다고 생각한다”고 말했다.


현대인 기자 modernman@etnews.com


브랜드 뉴스룸