ASCII (American Standard Code for Information Interchange, 미국 정보 교환 표준 부호)는 초창기 문자 집합 중 하나로, 영어 알파벳과 아라비아 숫자, 그리고 일부 특수 문자를 포함한다.
아스키 문자 집합에 속한 문자는 7비트로 표현되는데 7비트로 표현할 수 있는 정보의 가짓수는 2^7 = 128개 문자이다.
(실제로는 8비트를 사용하나 그중 1비트를 패리티 비트(parity bit)라고 불리는 오류검출 비트로 사용하기 때문에 실제 문자 표현을 위해 사용되는 비트는 7비트다.)
표에서 보듯이 아스키 문자들은 0부터 127까지 총 128개의 숫자 중 하나의 고유한 수에 일대일로 대응됩니다.
예를 들어 'A'는 십진수 65로 인코딩되고, 'a'는 십진수 97로, 특수 문자 !는 십진수 33으로 인코딩됩니다.
참고로 아스키 코드 표를 보면 Backspace, Escape, Cancel, Space와 같은 제어 문자도 아스키 코드에 포함되어
있다는 사실이 있다. (문자 인코딩에서 '글자에 부여된 고유한 값'을 코드 포인트(code point)이다. 가령 아스키 문자 A의 코드 포인트는 65이다.)
아스키 코드는 매우 간단하게 인코딩된다는 장점이 있지만, 한글을 표현할 수 없다는 단점이 있습니다.
근본적으로 128개보다 많은 문자를 표현하지 못하기 때문입니다. 그래서 영어권 외의 나라들은 고유한 문자 집합과 인코딩 방식이 필요하다고 생각했습니다. EUC-KR입니다.
출처
혼자 공부하는 컴퓨터 구조 운영체제
'혼자 공부하는 컴퓨터 구조 운영체제' 카테고리의 다른 글
[1차시] RAM와 ROM에 대해서 알아보자! (0) | 2023.09.01 |
---|