ホラズム文字(ホラズムもじ、英語: Chorasmian)は、Unicodeのブロックの一つ。
解説
2世紀から9世紀ごろにかけて、現在のウズベキスタン及びトルクメニスタンにあたる、中央アジアのアムダリヤ川のデルタ地帯に位置するホラズム地域で話されていた、インド・ヨーロッパ語族インド・イラン語派イラン語群東イラン語群に属する、現在は死語となったホラズム語を表記するためのホラズム文字を収録している[1]。この文字体系は、古典ペルシア語での呼称 مزراوخ(xvārazm) に由来して“Khwarezmian”としても知られている[2]。
なお、この文字体系が用いられていた地域は中央アジアであったが、Unicodeのバージョン16.0現在、Unicode公式のCode Chartsでは中東の文字体系として分類されている。
ホラズム文字はアラム文字から派生した文字体系であり、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類される。書字方向は通常アラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)であるが、一部の文書には文字を反時計回りに90度回転させ、モンゴル文字のように左から右へと行を送る縦書き(左縦書き)で書かれたものも存在する[1]。Unicode上では右横書き文字として定義されている[3]。また、単語毎に分かち書きをする[1]。
アラビア文字と同様に単語内の位置(独立・語頭・語中・語末)によって字形が変化する。文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることで、その字形を表現することができる。例えば字母aleph(U+10FB0 𐾰
)の語中形は𐾰U+200D U+10FB0 U+200D
の形で表すことができる[1]。
大きく分けて文字の単語位置による変化が存在せず文字が分かれて書かれる「石刻文字(lapidary)」と、上述のように文字が連結して書かれる「筆記体(cursive)」の2種類の書体が存在するが、Unicode上では石刻文字は帝国アラム文字と同じ文字体系として符号位置を統一されており、Unicode公式では筆記体のものを代表グリフとしている[1]。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(ホラズム数字)を有している。
符号位置の順序及び文字名は帝国アラム文字のものに従っている[1]。
Unicodeのバージョン13.0において初めて追加された。
収録文字
コード
|
文字
(独立形)
|
文字名(英語)
|
語頭形
|
語中形
|
語末形
|
用例・説明
|
ラテン文字転写
|
字母
|
U+10FB0
|
𐾰
|
CHORASMIAN LETTER ALEPH
|
𐾰
|
𐾰
|
𐾰
|
子音[ʔ]を表す。
|
ʾ
|
U+10FB1
|
𐾱
|
CHORASMIAN LETTER SMALL ALEPH
|
𐾱
|
𐾱
|
𐾱
|
子音[ʔ]を表す。
|
ʾ
|
U+10FB2
|
𐾲
|
CHORASMIAN LETTER BETH
|
𐾲
|
𐾲
|
𐾲
|
子音[b]を表す。
|
b
|
U+10FB3
|
𐾳
|
CHORASMIAN LETTER GIMEL
|
𐾳
|
𐾳
|
𐾳
|
子音[ɡ]を表す。
|
g
|
U+10FB4
|
𐾴
|
CHORASMIAN LETTER DALETH
|
𐾴
|
𐾴
|
𐾴
|
子音[d]を表す。
|
d
|
U+10FB5
|
𐾵
|
CHORASMIAN LETTER HE
|
𐾵
|
𐾵
|
𐾵
|
子音[h]を表す。
|
h
|
U+10FB6
|
𐾶
|
CHORASMIAN LETTER WAW
|
𐾶
|
𐾶
|
𐾶
|
子音[w]を表す。
|
w
|
U+10FB7
|
𐾷
|
CHORASMIAN LETTER CURLED WAW
|
𐾷
|
𐾷
|
𐾷
|
子音[w]を表す。
|
w
|
U+10FB8
|
𐾸
|
CHORASMIAN LETTER ZAYIN
|
𐾸
|
𐾸
|
𐾸
|
子音[z]を表す。
|
z
|
U+10FB9
|
𐾹
|
CHORASMIAN LETTER HETH
|
𐾹
|
𐾹
|
𐾹
|
子音[ħ]を表す。
|
ḥ
|
U+10FBA
|
𐾺
|
CHORASMIAN LETTER YODH
|
𐾺
|
𐾺
|
𐾺
|
子音[j]を表す。
|
y
|
U+10FBB
|
𐾻
|
CHORASMIAN LETTER KAPH
|
𐾻
|
𐾻
|
𐾻
|
子音[k]を表す。
|
k
|
U+10FBC
|
𐾼
|
CHORASMIAN LETTER LAMEDH
|
𐾼
|
𐾼
|
𐾼
|
子音[l]を表す。
|
l
|
U+10FBD
|
𐾽
|
CHORASMIAN LETTER MEM
|
𐾽
|
𐾽
|
𐾽
|
子音[m]を表す。
|
m
|
U+10FBE
|
𐾾
|
CHORASMIAN LETTER NUN
|
𐾾
|
𐾾
|
𐾾
|
子音[n]を表す。
|
n
|
U+10FBF
|
𐾿
|
CHORASMIAN LETTER SAMEKH
|
𐾿
|
𐾿
|
𐾿
|
子音[s]を表す。
|
s
|
U+10FC0
|
𐿀
|
CHORASMIAN LETTER AYIN
|
𐿀
|
𐿀
|
𐿀
|
子音[ʕ]を表す。
|
ʿ
|
U+10FC1
|
𐿁
|
CHORASMIAN LETTER PE
|
𐿁
|
𐿁
|
𐿁
|
子音[p]を表す。
|
p
|
U+10FC2
|
𐿂
|
CHORASMIAN LETTER RESH
|
𐿂
|
𐿂
|
𐿂
|
子音[r]を表す。
|
r
|
U+10FC3
|
𐿃
|
CHORASMIAN LETTER SHIN
|
𐿃
|
𐿃
|
𐿃
|
子音[ʃ]を表す。
|
š
|
U+10FC4
|
𐿄
|
CHORASMIAN LETTER TAW
|
𐿄
|
𐿄
|
𐿄
|
子音[t]を表す。
|
t
|
数値
|
U+10FC5
|
𐿅
|
CHORASMIAN NUMBER ONE
|
|
|
|
単位数字の1
|
|
U+10FC6
|
𐿆
|
CHORASMIAN NUMBER TWO
|
|
|
|
単位数字の2
|
|
U+10FC7
|
𐿇
|
CHORASMIAN NUMBER THREE
|
|
|
|
単位数字の3
|
|
U+10FC8
|
𐿈
|
CHORASMIAN NUMBER FOUR
|
|
|
|
単位数字の4
|
|
U+10FC9
|
𐿉
|
CHORASMIAN NUMBER TEN
|
|
|
|
単位数字の10
|
|
U+10FCA
|
𐿊
|
CHORASMIAN NUMBER TWENTY
|
|
|
|
単位数字の20
|
|
U+10FCB
|
𐿋
|
CHORASMIAN NUMBER ONE HUNDRED
|
|
|
|
単位数字の100
|
|
小分類
このブロックの小分類は「字母」(Letters)、「数値」(Numbers)の2つとなっている[2]。
字母(Letters)
この小分類にはホラズム文字のうち、基本的な字母が収録されている。
数値(Numbers)
この小分類にはホラズム文字のうち、位取り記数法を用いず、単位数字を並べて表現する数値記号(Unicode上では10進法の位取り記数法を用いる"digit"とは区別される)が収録されている。
文字コード
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
|
コードポイント[a]
|
文字数
|
L2 ID
|
ドキュメント
|
13.0
|
U+10FB0..10FCB
|
28
|
L2/18-164
|
Anshuman Pandey (25 July 2018), Proposal to encode the Chorasmian script (revision 2) (英語)
|
- ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
|
出典
- ^ a b c d e f Anshuman Pandey (2018年7月25日). “Proposal to encode the Chorasmian script (revision 2)” (英語). Unicode. 2025年5月28日閲覧。
- ^ a b "The Unicode Standard, Version 15.1 - U10FB0.pdf" (PDF). The Unicode Standard (英語). 2025年5月28日閲覧。
- ^ “Roadmap to the SMP”. www.unicode.org. 2025年5月27日閲覧。
関連項目