이 문서에는 옛 한글이 포함되어 있습니다. 관련 글꼴이 설치되지 않은 경우, 일부 문자가 깨진 글자로 표시될 수 있습니다. 관련 도움말은 다국어 지원 가이드를 참고하세요. 옛 한글 도움말을 참고하여 볼 수 있습니다.
KS X 1026-1은 2007년12월 31일에 제정된 한국산업표준으로, 정식 표준명은 정보기술 – 국제문자부호계(UCS) – 한글 – 제1부: 정보교환용 한글 처리지침이다.
이 규격은 국제 문자 세트(UCS) 또는 유니코드를 이용하여 정보 처리 및 데이터를 전송하는 시스템 사이에서 정보 교환에 사용되는 한글(옛한글 포함)의 표현 형식 및 처리 방법에 대하여 규정한다.
주요 내용
이하 '조합형 한글 낱자'는 한글 자모(Hangul Jamo, U+1100~U+11FF), 한글 자모 확장-A(Hangul Jamo Extended-A, U+A960~U+A97F), 한글 자모 확장-B(Hangul Jamo Extended-B, U+D7B0~U+D7FF) 영역에 속한 문자를 말한다.
한글 낱자 하나를 단독으로 표현할 때
한글 호환 자모(Hangul Compatibility Jamo, U+3130~U+318F) 영역의 한글 낱자는 단독으로 사용하며, 채움 문자를 넣지 않는다.
예: ㄱ U+3131, ㅏ U+314F
조합형 한글 낱자는 반드시 채움 문자와 함께 사용해야 한다. 초성만 단독으로 나타내는 경우 중성 채움 문자(U+1160)를 뒤에 붙여야 하고, 중성만 단독으로 나타내는 경우 초성 채움 문자(U+115F)를 앞에 붙여야 하고, 종성만 단독으로 나타내는 경우 초성 채움 문자와 중성 채움 문자(U+115F U+1160)를 앞에 붙여야 한다.
U+11EC ᇬ, U+11ED ᇭ, U+11EE ᇮ, U+11EF ᇯ의 ㅇ(이응)을 ㆁ(옛이응)으로 바로잡았다. 글꼴을 만들 때는 ㅇ이 아니라 ㆁ으로 디자인해야 하며, 정렬할 때도 ㅇ이 아니라 ㆁ의 뒤쪽으로 정렬해야 한다.
정규화
옛한글에 유니코드 정규화 형식 C(NFC) 또는 KC(NFKC)를 적용하면 '현대 한글 초성 + 현대 한글 중성 + 옛한글 종성'이 '현대 한글 완성자 + 옛한글 종성'으로 바뀌어 버리는 문제가 있다. KS X 1026-1은 이런 경우에 현대 한글 완성자를 사용하지 말고 조합형 한글 낱자들만을 사용할 것을 요구한다. 부속서 B에 한글 정규화 처리 알고리즘이 있다.