한중일 호환용 한자(CJK Compatibility Ideographs)는 유니코드에서 기존의 한·중·일문자 집합과 왕복 변환을 위해 한중일 통합 한자에 집어넣은 중복된 한자들이다. 대표로 KS X 1001의 독음만 다르고 모습은 같은 한자들과 Big5의 버그인 중복된 두 한자가 있다. 최근에는 JIS X 0213, 국규 9566, CNS 11643-1992와 호환을 위한 한자도 추가했다. 열두 글자를 제외한 모든 호환용 한자들은 각각 정규 한자 영역에 있는 한자들과 중복되거나 통합할 수 있는 글자들이다.
예를 들어, KS X 1001의 소리가 다른 중복 한자들은 대표 글자 하나만 정규 한자 영역에 넣고, 나머지 한자들은 호환용 한자 영역에 넣었다. KS X 1001에서 소리가 가장 많은 한자인 樂의 경우 다음과 같이 배당했다.
한중일 호환용 한자 영역이 유니코드에서 차지하는 부분
소리
한자
KS X 1001
유니코드
대표
낙
樂
0xD1E2
U+F914
락
樂
0xD5A5
U+F95C
악
樂
0xE4C5
U+6A02
O
요
樂
0xE8F9
U+F9BF
Big5의 중복된 두 한자는 U+FA0C(兀, 올), U+FA0D(嗀, 혹)에 따로 배당했다.
역사
1991년, 유니코드 1.0에서 U+F900부터 U+FA2D까지 처음으로 ‘한중일 호환용 한자’ 302글자를 배당했다. (KS X 1001 중복 한자 268글자, Big5 중복 한자 2글자, IBM 32 호환용 한자 32글자)
2001년, 유니코드 3.1에서 U+2F800부터 U+2FA1D까지 ‘한중일 호환용 한자 보충’ 542글자를 배당했다. (모두 CNS 11643-1992 중복 한자)
2002년, 유니코드 3.2에서 U+FA30부터 U+FA6A까지 ‘한중일 호환용 한자’에 59글자를 더 추가했다. (모두 JIS X 0213 호환용 한자)
2005년, 유니코드 4.1에서 U+FA70부터 U+FAD9까지 ‘한중일 호환용 한자’에 106글자를 더 추가했다. (모두 국규 10721 호환용 한자)
2009년, 유니코드 5.2에서 U+FA6B부터 U+FA6D까지 ‘한중일 호환용 한자’에 3글자를 더 추가했다. (모두 일본 ARIB STD-B24 호환용 한자)
2012년, 유니코드 6.1에서 U+FA2E(郞)와 U+FA2F(隷) 두 자를 '한중일 호환용 한자'에 추가했다. (모두 KS X 1001:2004 중복 한자 2글자)
문자표
한중일 호환용 한자 (CJK Compatibility Ideographs) 유니코드 공식 문자표
IBM 32에서 추가된 호환용 한자 중 12개는 한중일 통합 한자 영역에 대응되는 쌍이 없는 한자로, 이에 따라 실제로는 한중일 통합 한자로 간주된다.
U+FAD4
U+FAD4(䀹)는 ⿰目㚒의 자형을 가지고 있으나, U+9FC3(鿃, 섬)이 아닌, ⿰目夾의 자형을 가진 U+4039(䀹, 협)과 동일한 호환용 한자로 정의되어 있다. 이는 U+4039가 ⿰目夾의 자형을 가진 한자와 ⿰目㚒의 자형을 가진 한자를 동시에 가리킬 적에, U+FAD4가 ⿰目㚒만을 가리킬 용도로 추가되었기 때문이다. 이후 ⿰目夾과 ⿰目㚒이 서로 다른 글자라는 것이 알려져서 U+4039의 분리가 승인되어 유니코드 5.1에서 ⿰目㚒이 U+9FC3으로 분리되었으나, 유니코드에서 한 번 정의된 글자는 그 정의를 변경할 수 없는데다가, 호환용 한자의 특성 상 U+FAD4의 정의를 변경하지 못하는 것이 큰 문제를 일으키지도 않기 때문에, U+FAD4는 U+4039의 분리 이후로도 여전히 U+9FC3이 아닌 U+4039를 가리키고 있다.[3]