인코딩

인코딩(encoding)이란 파일에 저장된 정보의 형태를 다른 것으로 변경하는 것을 말하며 부호화(符號化)라고도 불린다. 파일 압축이나 암호화 등의 목적으로 인코딩을 한다. 반대말은 디코딩(decoding)이다.

개요

영어단어 인코딩(encoding)은 코드화, 부호화, 암호로 바꾸다, 부호화하다라는 뜻이다. 인코딩은 컴퓨터 정보의 형태나 형식을 표준화, 보안, 처리 속도 향상, 저장 공간 절약 등을 위해서 다른 형태나 형식으로 변환하는 것을 말한다. 인코더(encoder) 또는 부호기는 인코딩을 수행하는 장치나 컴퓨터 소프트웨어를 말한다. 또한 보통 인코딩을 생각하면 컴퓨터에서 동영상이나 문자 인코딩을 생각하는데, 이 외에도 사람이 인지할 수 있는 형태의 데이터는 전부 인코딩할 수 있다.

대표적인 사례

컴퓨터에서 사용되는 오디오, 텍스트, 동영상 파일의 표준화 및 보안을 위한 암호화에 사용된다.

코덱은 오디오나 동영상 파일의 크기를 줄이거나, 컴퓨터에서 신속하게 자료를 처리하기 위해 사용된다.
오디오 인코딩은 주로 오디오를 다른 표준화된 형식으로 바꾸거나, 위에서 언급한 이유를 위해 사용된다.
동영상 인코딩도 위와 같은 이유로 사용된다. 혹은 PPT에서 mp4 파일을 재생하기 위하여 다른 파일로 바꿀 때 필요하다.
문자도 위와 같은 이유로 사용된다. 컴퓨터와 사용자가 기계어로만 소통하던 시기에 많은 애로사항이 있었고 이를 해결하고자 등장하였다. 문자 인코딩의 대표적인 예로는 아스키코드와 유니코드가 있다.
- 아스키 코드(ASCII) / 한글 KS완성형(euc-kr)
  - 아스키 코드는 영문/숫자 1글자는 1바이트, 한글/한자 1글자는 2바이트이다. 하나의 인코딩당, 영문과 또다른 하나의 언어만 사용할 수 있다. 한국어 아스키 코드인 완성형(euc-kr) 인코딩에서는 영문과 한글 그리고 한국에서 사용되는 한자만 표현할 수 잇습니다. 물론 일본어도 섞여 잇지만, 일본어 인코딩이 아니기에 일본인은 읽을 수 없다. 그래서 하나의 파일에 여러 언어를 동시에 표현하기가 힘들거나 불가능하다. 대신에 컴퓨터 초창기부터 사용되어 왔기에 호환성이 아주 좋고 MS윈도우 2000/XP이상의 운영체제에서는, 내부적으로 유니코드를 사용하지만, 사용자가 실제로 읽고 쓰는 텍스트 문서는 대부분 아스키 코드이다.
- 유니코드(Unicode/UTF-8)
  - 영문/숫자/한글/한자 등 모든 글자는 이론적으로 2바이트로 적용한며 최대 6바이트까지 사용한다. 그리고 파일에 저장될 때도 2바이트로 저장한다. 희귀한 특수문자나 문자들은 2바이트를 초과할 수도 있다. 단, UTF-8 유니코드가 파일에 저장될 때, 영문/숫자는 아스키 코드와 똑같이 1바이트를 사용하고, 한글 등은 3바이트로 파일에 저장된다. UTF-8 유니티코드는 아스키 코드와 영문 영역에서 100% 호환된다. 만약 UTF-8 유니코드 문서에 한글 등이 전혀 없고, 영문과 숫자로만 이루어져 있다면, 그 파일은 아스키 코드와 동일하게 볼 수 있다. 또한 웹페이지를 유니코드로 작성 할 때는 UTF-8 유니코드를 사용한다. 아스키 코드와 차이점은 전세계의 모든 언어를 하나의 파일에 쓸 수 있다는 것(다만 언어에 해당하는 폰트는 설치가 되있어야함)과 유니코드의 역사가 그리 길지 않아서, 아직도 유니코드를 잘 인식하지 못하는 컴퓨터가 간혹가다 존재한다. 현재는 사용하지 않지만 예를 들어 윈도우 98이나 오래된 유닉스 시스템의 경우에 그렇다.
무선 인터넷 등에서 사용하는 데이터의 보안을 위해 사용된다.

적용 사례1

전자공학에서 적용 사례1

같이 보기

코인위키

이름공간

변수

보기

더 보기

검색

인코딩

개요

대표적인 사례

같이 보기