ASKII Code 와 UniCode

2022-10-22

아스키코드와 유니코드에 대해 알아보기 전에 문자 인코딩에 대해 먼저 알아보자


문자인코딩?

사람이 입력한 문자, 기호등을 컴퓨터가 알아들을 수 있는 신호로 변환하는 것

컴퓨터는 0과 1로 이루어진 바이너리로 정보를 저장한다. 하지만 우리는 컴퓨터를 통해 우리가 이해할 수 있는 언어로 정보들을 관리한다 이게 어떻게 가능한일일까?

우리가 키보드로 입력한 문자들을 컴퓨터가 이해할 수 있는 신호로 변화하는 인코딩이 이루어졌기 때문이다.

인코딩 과정을 거치려면 정해진 기준이 필요하다. 여기서 말하는 기준이란 인코딩의 표준을 정하는 것이고

이 문자 인코딩의 가장 대표적인 아스키(ASKII)코드유니코드(Unicode) 에 대해 알아보자


ASCII코드(American Standard Code for Information Interchange)

ASCII코드는 영문 알파벳을 사용하는 대표적인 문자 인코딩 이다.

아스키는 컴퓨터와 통신 장비를 비롯한 문자를 사용하는 많은 장치에서 사용되며, 대부분의 문자 인코딩이 아스키에 기초를 두고 있다

아스키 코드는 영어 알파벳을 기반으로 문자 인코딩을 하며, 문자 하나를 7비트로 표현하기 때문에 이진수 조합으로 만들어진 128개의 부호를 표현할 수 있는 코드이다.

아스키 코드에서는 0 ~ 31번과 127번은 제어 문자, 32 ~ 64번은 특수 문자와 숫자, 65 ~ 96번은 알파벳 대문자와 특수문자, 97 ~ 126번은 알파벳 소문자와 특수문자를 나타내고 있다.



아스키코드는 7비트로 문자를 표현한다. 2^7 = 128개의 부호 밖에 표현할 수 없는 아스키 코드를 보완하기 위한 8비트의 ANSI코드가 나오기도 했지만 256개의 부호로도 전 세계의 문자를 표현하기에는 한계가 있었다

이 문제를 해결할 수 있는 방법이 바로 유니코드


유니코드

유니코드는 전 세계의 모든 문자를 컴퓨터에서 표현할 수 있도록 만들어진 문자 인코딩 표준이다.

유니코드는 2byte (16bit)로 문자를 표현한다. 따라서 2^16 = 65,536 개의 문자를 표현 할 수 있다



유니코드 문자의 경우 해당 글자의 코드를 표기할 때 U+(16진수 숫자) 라고 쓴다

예를 들어 한글 ‘가’는 유니코드에서 16진수로 AC00(10진수의 44032)라는 코드 넘버를 가지는데, 이것을 U+AC00이라고 적는 방식이다.

© 2024 SongChangYeop All rights reserved