본문 바로가기

비전공자 스터디노트

아스키코드, 유니코드 변환 형식 8비트

아스키 코드

수를 이용해 문자나 키보드에 있는 다른 기호 등을 표현하는 방법 중 가장 대표적인 것이 바로 아스키코드다.

정보교환을 위한 미국 표준코드라고도 부르고

American Standard Code for Information Interchange를 줄여서 ASCll라고 한다. 

아스키코드에서 중요한건 A가 10진수로하면 65, 16진으로하면 0x41이라는 것만 알면 된다.

아스키코드와 경쟁에서 진 코드는 IBM의 확장 BCD 교환 코드인데 펀치카드를 사용한 인코딩기반 코드이다.

펀치카드는 아래그림처럼 구멍이 뚫려있는 카드를 말한다. 

펀치카드

아스키코드는 글자를 출력하는 것이 아니라 장치를 제어하기 위해 쓰이기 때문에 제어문자라고 불리는데

제어문자들마다 용도가 다르다.

ex) NULL, STX, EOT, ACK, BS, NL, FF, SO, DLE

 

다른표준의 진화

영어외의 다른 언어를 지원해야 할 필요가 있어 국제 표준화 기구(ISO)가 ISO-646과 ISO-8859를 도입했다.

거의 아스키+발음 구별기호 형식으로 구성되어있다.

 

일본 산업표준(JIS)는 일본문자 표현을 위해 JISX 0201을 만들었고

한국어 표준은 KS C 5601이 있다.

 

후에 비트의 가격이 떨어지면서 유니코드(Unicode)라는 새로운 표준이 등장했고 문자에 16비트 코드를 가지고 있다.

 

유니코드 변환 형식 8비트 (UTF-8)

유니코드는 각각의 문자 코드에 따라 다른 인코딩을 사용한다.

                                                       -> 다른 비트패턴을 표현하기 위해 사용하는 비트패턴

 

개발을 하다보면 항상 UTF-8을 사용하는데 하위 호환성과 효율성이 좋기 때문이다.

반응형