마이크로소프트 엑셀은 대표적인 스프레드시트 프로그램이다. 편리하고 효율적이기 때문에 데이터 입력과 분석용으로 많이 사용되고 있다. 엑셀 초보자가 자주 저지르는 실수는 셀 속성이다. 셀 입력시 문자인지 숫자인지 속성을 정해주지 않으면 엑셀은 자동으로 속성을 파악해 저장한다. 때문에 문자가 숫자로 바뀌어 오류가 생기는 경우가 종종 발생한다.
과학자들도 이런 실수 때문에 논문에서 치명적인 오류가 발생하고 있다는 지적이 제기됐다.
오스트리아 연구팀은 최근 발행된 `지놈 바이올로지(Genome Biology)`에서 많은 유전학 분야 논문이 엑셀에서 발생할 수 있는 오류를 포함하고 있는 것으로 조사됐다고 밝혔다.
연구팀은 사이언스·네이처 등 주요 학술지에 게재된 총 3600개 유전학 논문 엑셀데이터를 조사했다. 결과는 놀라웠다. 약 25%가 유전자 이름이 자동으로 날짜나 임의 숫자로 바뀌는 엑셀 속성 오류를 포함하고 있었다.
예를 들면 유전자 `Septin2`의 약자 `SEPT2`을 타이핑하면 엑셀이 자동으로 날짜로 인식해 `9월2일`로 바꿔버린다는 것이다. 속성변경을 취소(Undo)하면 모든 데이터가 지워지기도 한다. 또 `SEPT2`가 타이핑된 상태에서 속성을 텍스트로 바꾸면 `42615`로 기록된다. `2016년 9월 2일`을 뜻하는 엑셀 내부 숫자 코드다. `March1`도 마찬가지로 이런 오류가 나타나는 대표적인 유전자다.
연구팀은 10년전에 이런 문제가 지적됐음에도 실수가 계속되고 있는 것은 `과학자의 성의 문제`라고 밝혔다. 실수를 방지하기 위해서는 데이터를 입력하기 전에 속성을 정하는 습관을 들이는 것이 중요하다는 지적이다. 연구팀은 “이처럼 주의를 촉구하는 것은 연구자가 사소한 오류로 논문을 망치지 않기를 바라기 때문”이라고 밝혔다.
권상희기자 shkwon@etnews.com