unicode 2

유니코드 내 한글

유니코드에서 한글은 세 군데에 나뉘어서 위치한다. 조합된 모든 한글(가~힣) U+AC00 ~ U+D7A3 자음+모음 또는 자음+모음+받침으로된 모든 한글 문자가 이 영역에 있다. NFC(Normalization Form Canonical Composition) 방식에서 사용한다. 아래 표를 보고 공식에 각 번호를 대입해서 문자의 위치를 알아낼 수 있다. [(초성 번호) * 588 + (중성 번호) * 28 + (종성 번호)] + 44032 예를 들어 ‘글’자를 찾는 다면 (ㄱ(0) * 588 + ㅡ(18) * 28 + ㄹ(8)) + 44032 = 44544 가 되고 이를 16진수로 바꾸면 0xAE00 이고 U+AE00 이 ‘글’자이다. 번호 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ..

정리 2019.03.17

유니코드 (Unicode)

전 세계의 모든 문자를 컴퓨터에 저장하는 방법에 대한 표준 Character Point U+AC00 이라는 형태로 유니코드를 표현할 때, 특정 글자가 할당 받은 위치인 AC00이라는 16진수를 Character Point 또는 Code Point라고 부른다. 인코딩(부호화) 방식 UTF-8 가장 널리 쓰임 ascii 와 호환됨 UTF-16 Windows에서 시스템 기본 인코딩 방식으로 사용 모든 문자에 16비트가 할당되어 글자 수 계산이 편함 UTF-32 유니코드에 할당된 값(Code Point)을 그대로 표현함 UCS-2 UTF-16과 비슷하다. 옛날 문서에 그냥 유니코드라고 지칭하면 이걸 이야기한다. 표현 방법 기본(예) U+AC00 일반적으로 유니코드 문자를 설명할 때 사용 Escape Sequen..

정리 2019.03.17