컴퓨터를 사용하는 사람들이 간혹 부딪히는 문제중 하나는 디스크 용량이 부족해 더이상의 파일을 만들수 없는 경우다. 요즘 많이 보급되어 쓰이는 486 급 멀티미디어 PC는 하드디스크 용량이 5백40MB, 5.25인치는 FDD는 1.2M B, 3.5인치는 1.44MB, 그리고 CD-롬은 6백80MB에 이르러, 전체적으로 예전에 비하면 실로 경이적인 대용량을 갖추고 있다.
그러나 그만큼 운용체계를 비롯한 응용 소프트웨어들이 크기가 커지고 종류 도 많아졌으며 사용자 자신이 만드는 파일도 많아져, 항상 디스크 용량의 부족을 느끼게 된다. 더구나 인터네트같은 컴퓨터 통신망을 통해 전세계로부터 원하는 정보를 다운로드 받을 수도 있고, 영상데이터나 웬만큼 긴 파일 몇개면 금세 하드디스크가 가득찬다.
긴 파일에 있어서는 디스크 용량도 문제지만 느린 전송속도로 인한 오랜 전송시간도 큰 문제다. 아직 우리나라와 미국간 인터넷의 전송속도가 2백56Kb ps에 불과해 큰 파일을 밤새도록 다운로드 받는 경우가 종종 있고 운이 나쁘면 도중에 끊어져 다음날 다시 시작할 때도 있다.
이상의 두 문제를 동시에 해결하는 방법으로 디스크를 절약하고 전송시간을 줄이기 위해 쓰이는 방법이 바로 파일 압축이다. PKZIP, ARJ, LHA등은 PC에서 널리 쓰이고 있는 파일 압축용 프로램들이다. 또 UNIX에서 널리 쓰이는대표적인 파일 압축 프로그램으로는 컴프레스 명령이 있다. 이러한 압축 프로그램은 평균적으로 파일 크기를 약 50%정도 줄이는데, 복원하면 원래의 파일을 완전하게 재생한다. 따라서 무손실 압축이라고 불린다.
멀티미디어의 핵심기술은 영상, 음향, 음성, 문자, 도형, 일반 데이터 등의 정보를 각 정보의 특성에 따라 압축하는 일이다. 압축하지 않을 경우 지난 호에서 살펴보았듯이 데이터양이 과다하여 전송이나 저장에 많은 어려움이 따른다. 영상 음향, 음성등 인간이 시청각 기관으로 "느끼는" 정보는 눈이나 귀가 거의 느낄 수 없을 정도의 에러를 허용하여 압축률을 높일 수 있다. 이러한 방식으로 압축한 정보는 복원시 원래의 값과는 약간의 차이가 있으나 눈이나 귀에 느껴지지만 않는다면 문제될 것이 없다. 이러한 소위 손실 부호화를 통해 MPEG에 있어서 영상은 30분의1 이상, 음향과 음성은 6분의1 이상의 압축 률을 얻을 수 있다.
반면 문자, 도형, 일반 데이터, 컴퓨터 파일 같이 손실을 허용할 수 없는 경우에는 압축률이 2분의1 정도로 낮더라도 원래 값을 완전히 복원할 수 있는소위 무손실 압축을 적용한다. MPEG는 전체를 하나로 보면 손실부호화이지만 그 구성 요소를 살펴보면 손실 부호화와 무손실 부호화가 결합되어 있다. 즉 먼저 손실 부호화에 의해 압축률을 높인 뒤 부호화에 의해 압축률을 더욱끌어올리고 있다.
데이터 압축은 데이터에 내재되는 중복성을 없애고 마치 인삼의 엑기스를 추출하듯 꼭 필요한 성분만을 뽑아내는 과정이다. 예를 들어 미국처럼 현재의지상TV채널을 이용하여 HDTV방송을 하는 경우, 영상에 대해서 60분의1 정도의 압축률이 필요한데 이는 곧 원래 신호의 1.6% 정도의 분량만을 전송하는 것을 의미한다. 따라서 이 1.6%만을 가지고 복원하더라도 원래 영상과 차이 가 거의 느껴지지 않도록 하기 위해서는 고도의 압축기술이 요구된다. 따라서 어느 한 기법이 아니고 여러 효과적인 압축방법들을 복합적으로 이용하는하이브리드방식을 사용할 때가 많다.
영상의 경우를 예로 들면 영상데이터에 내재하는 중복성은 크게 세 종류로 분류된다. 우선 초당 24장(영화) 혹은 30장(NTSC 컬러TV)의 화면이 발생할 때 이웃하는 두장의 화면은 매우 비슷하다. 정지한 경우 완전히 같고 움직임이 있더라도 그 부분을 제외하면 배경은 같은데 이것이 화면과 화면사이에 존재하는 시간적 중복성이다. 또 한 화면내에서도 이웃하는 화소끼리는 그값 들이 매우 비슷한데 이것이 화소와 화소 사이에 존재하는 공간적 중복성이다. 시간적 중복성과 공간적 중복성을 없애기 위해 손실부호화를 이용하고있는데 보다 구체적으로 움직임 보상 DPCM과 이산여현변환(DCT)과 양자화가 그것이다. 한편 양자화된 움직임보상 DCT계수들은 통계적으로 어떤 값들은 자주나오고 어떤 값들은 희박하게 나타난다. 이것이 앞서 파일 압축의 경우에도 해당되는 통계적 중복성이다. 이것을 없애기 위해서는 무손실 부호화를 이용하는데MPEG에서 사용하는 호프만 부호와 파일 압축시 사용하는 LZW 알고리듬이 그대표적 예다.
SW 많이 본 뉴스
-
1
국내 최초 휴머노이드 로봇 쇼룸 문 연다…로봇이 춤추고 커피도 내려
-
2
서울시, '손목닥터9988' 자치구에 개방…하반기 커뮤니티 기능 도입
-
3
“개인정보, 다크웹 3만~7만원 거래”…공공 설문 '보안 사각지대' 경고
-
4
SAS, 양자 AI 사업 시동…'퀀텀 랩'으로 산업별 난제 해결
-
5
[오피스인사이드] “일터가 아닌 삶터” 유라클, 신사옥에 담은 변화의 시작
-
6
AISH·금천구·서울시립대·동양미래대·금천구상공회, 'G밸리 AI 스마트워크 생태계 구축' 업무협약 체결
-
7
개인정보위 “듀오 유출 정보, 다크웹 모니터링 강화”
-
8
정부, 공공기관 온라인 설문 지침 강화…현장 점검 확대
-
9
알파벳, 1분기 매출 163조원…클라우드 매출 63%↑
-
10
해성디에스-인터엑스, AX 자율제조 파트너십…반도체 제조 'AI 자율화' 앞당긴다
브랜드 뉴스룸
×



















