カローシュティー文字 (カローシュティーもじ、英語 : Kharoshthi )は、Unicode のブロック の一つ。
解説
アショーカ王碑文 などに見られる、紀元前250年 から紀元後3世紀 ごろにかけて、現在のパキスタン 北部とアフガニスタン 東部に存在していたガンダーラ 王国で話されたプラークリット (中期インド語)の一種である、インド・ヨーロッパ語族 インド・イラン語派 インド語群 に属するガンダーラ語 や、サンスクリット [ 1] の表記に用いられたカローシュティー文字 を収録している。
ガンダーラ地域では紀元3世紀頃には使われなくなったが、紀元後3世紀から4世紀 にかけては、現在の中華人民共和国 の新疆ウイグル自治区 にあたる中央アジア の都市ホータン 及びニヤ において公文書や碑文にも使用され、北方シルクロード 沿いのクチャ とその周辺地域では7世紀 まで残存していたと推測されている[ 1] 。
カローシュティー文字は南アジア の文字としては珍しくブラーフミー文字 から派生した文字体系(ブラーフミー系文字 )ではなく、アラム文字 に由来していると考えられている[ 1] 。音素文字 のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダ に分類されるが、アブギダとしては珍しくアラビア文字 やヘブライ文字 などと同様に右から左への横書き(右横書き )である。アラビア文字のような単語内位置による字形変化は存在しない。単語ごとの分かち書き は原則しない が、現代の学術的な慣習では分かち書き・ハイフネーション が行われる[ 1] 。子音連続など子音のみで発音する場合はU+10A3F
𐨿 KHAROSHTHI VIRAMA
(ヴィラーマ )という制御文字 を用いて子音字同士の特殊な合字を形成する。
加えて、アラビア文字 やタイ文字 などと同様に独自の数字体系(カローシュティー数字)を有している。
カローシュティー文字にはArapacana (アラパチャナ)と呼ばれる伝統的な文字の並び順があるが、カローシュティー文字がUnicodeに追加申請された当初は文字の完全な順序の記録が発見されていなかったため、符号位置の順序は学術的慣習に基づいておおむねブラーフミー文字の順序に従っている[ 1] 。なお、現在はArapacanaの完全な順序の記録が発見されているため、文字の正確なソート順序が判明している[ 2] 。
Unicodeのバージョン4.1において初めて追加された。
収録文字
「ラテン文字 転写」の列はブラーフミー系文字のラテン文字への翻字 方式の一つであるISO 15919 (及び一部はIAST )に従う。
コード
文字
文字名(英語)
用例・説明
ラテン文字転写
母音字
U+10A00
𐨀
KHAROSHTHI LETTER A
短母音[a ]を表す。
また、頭子音のない母音音節を表す子音字としても用いられる。
a
U+10A01
𐨁
KHAROSHTHI VOWEL SIGN I
短母音[i ]を表す。
子音字a, n, hでは子音字を横切る横線として、th, p, ph, m, l, śでは縦線として、それ以外の文字ではUnicode公式の例示字形のように右肩上がりの斜めの線として書かれる[ 1] 。
i
U+10A02
𐨂
KHAROSHTHI VOWEL SIGN U
短母音[u ]を表す。
子音字ṭ, hでは文字から離れた下付きの丸として、mでは特殊な合字(𐨨𐨂)を形成し、それ以外の文字では文字につながる下付きの丸として書かれる[ 1] 。
u
U+10A03
𐨃
KHAROSHTHI VOWEL SIGN VOCALIC R
音節主音 化した短母音としてのR(IPA :[ɹ̩])を表す。
子音字m, hでは文字から離されて書かれ、それ以外の文字では文字と重ねて書かれる[ 1] 。
r̥[ 3]
U+10A04
(予約済み)
l̥[ 4]
U+10A05
𐨅
KHAROSHTHI VOWEL SIGN E
短母音[e ]を表す。
子音字a, n, hでは子音字の右側に接する横線として、th, p, ph, m, l, śでは子音字の左上に接する縦線として、子音字d, mでは特殊な合字(𐨡𐨅, 𐨨𐨅)を形成し、それ以外の文字ではUnicode公式の例示字形のように上付きの右肩上がりの短い斜め線で書かれる[ 1] 。
e
U+10A06
𐨆
KHAROSHTHI VOWEL SIGN O
短母音[o ]を表す。
子音字p, ph, y, śでは文字の中央下側に接する縦線として、それ以外の文字では文字の左下に接する右肩上がりの斜め線として書かれる[ 1] 。
o
長音記号
U+10A0C
𐨌
KHAROSHTHI VOWEL LENGTH MARK
母音を長母音として発音することを表す。
U+0304 ̄ COMBINING MACRON
(マクロン )で転写される[ 1] 。
̄
各種記号
U+10A0D
𐨍
KHAROSHTHI SIGN DOUBLE RING BELOW
中央アジアのいくつかの文書に見られるが、正確な発音価値はまだ確立されていない[ 1] 。
U+035A ͚ COMBINING DOUBLE RING BELOW
で転写される[ 1] [ 5] 。
͚
U+10A0E
𐨎
KHAROSHTHI SIGN ANUSVARA
アヌスヴァーラ 。
直後に音節が後続する子音字に付き、直後の子音と同じ調音点 の鼻音 が挿入されることを表す。日本語 における「ん 」に相当する。
ṁ
U+10A0F
𐨏
KHAROSHTHI SIGN VISARGA
ヴィサルガ 。
音節末に[h ]を伴うことを表す。
ḥ
子音字
U+10A10
𐨐
KHAROSHTHI LETTER KA
子音[k ]を表す。
k
U+10A11
𐨑
KHAROSHTHI LETTER KHA
子音[kʰ]を表す。
kh
U+10A12
𐨒
KHAROSHTHI LETTER GA
子音[ɡ ]を表す。
g
U+10A13
𐨓
KHAROSHTHI LETTER GHA
子音[ɡʱ]を表す。
gh
U+10A14
(予約済み)
ṅ
U+10A15
𐨕
KHAROSHTHI LETTER CA
子音[c ]を表す。
c
U+10A16
𐨖
KHAROSHTHI LETTER CHA
子音[cʰ]を表す。
ch
U+10A17
𐨗
KHAROSHTHI LETTER JA
子音[ɟ ]を表す。
j
U+10A18
(予約済み)
jh
U+10A19
𐨙
KHAROSHTHI LETTER NYA
子音[ɲ ]を表す。
ñ
U+10A1A
𐨚
KHAROSHTHI LETTER TTA
子音[ʈ ]を表す。
ṭ
U+10A1B
𐨛
KHAROSHTHI LETTER TTHA
子音[ʈʰ]を表す。
ṭh
U+10A1C
𐨜
KHAROSHTHI LETTER DDA
子音[ɖ ]を表す。
ḍ
U+10A1D
𐨝
KHAROSHTHI LETTER DDHA
子音[ɖʱ]を表す。
ḍh
U+10A1E
𐨞
KHAROSHTHI LETTER NNA
子音[ɳ ]を表す。
ṇ
U+10A1F
𐨟
KHAROSHTHI LETTER TA
子音[t ]を表す。
t
U+10A20
𐨠
KHAROSHTHI LETTER THA
子音[tʰ]を表す。
th
U+10A21
𐨡
KHAROSHTHI LETTER DA
子音[d ]を表す。
d
U+10A22
𐨢
KHAROSHTHI LETTER DHA
子音[dʱ]を表す。
dh
U+10A23
𐨣
KHAROSHTHI LETTER NA
子音[n ]を表す。
n
U+10A24
𐨤
KHAROSHTHI LETTER PA
子音[p ]を表す。
p
U+10A25
𐨥
KHAROSHTHI LETTER PHA
子音[pʰ]を表す。
ph
U+10A26
𐨦
KHAROSHTHI LETTER BA
子音[b ]を表す。
b
U+10A27
𐨧
KHAROSHTHI LETTER BHA
子音[bʱ]を表す。
bh
U+10A28
𐨨
KHAROSHTHI LETTER MA
子音[m ]を表す。
m
U+10A29
𐨩
KHAROSHTHI LETTER YA
子音[j ]を表す。
y
U+10A2A
𐨪
KHAROSHTHI LETTER RA
子音[r ]を表す。
r
U+10A2B
𐨫
KHAROSHTHI LETTER LA
子音[l ]を表す。
l
U+10A2C
𐨬
KHAROSHTHI LETTER VA
子音[ʋ ]を表す。
v
U+10A2D
𐨭
KHAROSHTHI LETTER SHA
子音[ɕ ]を表す。
ś
U+10A2E
𐨮
KHAROSHTHI LETTER SSA
子音[ʂ ]を表す。
ṣ
U+10A2F
𐨯
KHAROSHTHI LETTER SA
子音[s ]を表す。
s
U+10A30
𐨰
KHAROSHTHI LETTER ZA
子音[z ]を表す。
z
U+10A31
𐨱
KHAROSHTHI LETTER HA
子音[h ]を表す。
h
U+10A32
𐨲
KHAROSHTHI LETTER KKA
ḱ[ 1]
U+10A33
𐨳
KHAROSHTHI LETTER TTTHA
ṭ́h[ 1]
U+10A34
𐨴
KHAROSHTHI LETTER TTTA
ṭ́[ 2]
U+10A35
𐨵
KHAROSHTHI LETTER VHA
子音[ʋʱ]を表す。
vh[ 2]
各種記号
U+10A38
𐨸
KHAROSHTHI SIGN BAR ABOVE
鼻音化や有気音化など、関係する子音に応じてさまざまな発音の変更を示すために使用される[ 1] 。
U+0304 ̄ COMBINING MACRON
(マクロン )で転写される[ 1] 。
̄
U+10A39
𐨹
KHAROSHTHI SIGN CAUDA
関連する子音のさまざまな変形発音、特に摩擦音化 を示すために使用される[ 1] 。
U+0301 ́ COMBINING ACUTE ACCENT
(鋭アクセント記号 )で転写される[ 1] 。
́
U+10A3A
𐨺
KHAROSHTHI SIGN DOT BELOW
正確な発音価値はまだ確立されていない[ 1] 。
U+0323 ̣ COMBINING DOT BELOW
(下付きドット符号 )で転写される[ 1] 。
̣
ヴィラーマ
U+10A3F
𐨿
KHAROSHTHI VIRAMA
ヴィラーマ 。殺母音記号。暗黙の随伴母音/-a/を発音せず子音のみが読まれることを表す[ 6] 。
単独のグリフ形状は任意であり、レンダー上は前の文字を次の文字と繋げた合字を形成する[ 1] ための不可視の制御文字 である[ 6] 。
数字
U+10A40
𐩀
KHAROSHTHI DIGIT ONE
数字の1
1
U+10A41
𐩁
KHAROSHTHI DIGIT TWO
数字の2
2
U+10A42
𐩂
KHAROSHTHI DIGIT THREE
数字の3
3
U+10A43
𐩃
KHAROSHTHI DIGIT FOUR
数字の4
4
数値と分数
U+10A44
𐩄
KHAROSHTHI NUMBER TEN
単位数字の10
10
U+10A45
𐩅
KHAROSHTHI NUMBER TWENTY
単位数字の20
20
U+10A46
𐩆
KHAROSHTHI NUMBER ONE HUNDRED
単位数字の100
100
U+10A47
𐩇
KHAROSHTHI NUMBER ONE THOUSAND
単位数字の1,000
1000
U+10A48
𐩈
KHAROSHTHI FRACTION ONE HALF
単位数字の1/2
½
約物
U+10A50
𐩐
KHAROSHTHI PUNCTUATION DOT
U+2022 • BULLET
(ブレット )で転写される[ 1] 。
•
U+10A51
𐩑
KHAROSHTHI PUNCTUATION SMALL CIRCLE
U+25E6 ◦ WHITE BULLET
で転写される[ 1] 。
◦
U+10A52
𐩒
KHAROSHTHI PUNCTUATION CIRCLE
U+25CB ○ WHITE CIRCLE
(白丸 )で転写される[ 1] 。
○
U+10A53
𐩓
KHAROSHTHI PUNCTUATION CRESCENT BAR
U+2208 ∈ ELEMENT OF
で転写される[ 1] 。
∈
U+10A54
𐩔
KHAROSHTHI PUNCTUATION MANGALAM
U+2295 ⊕ CIRCLED PLUS
で転写される[ 1] 。
⊕
U+10A55
𐩕
KHAROSHTHI PUNCTUATION LOTUS
U+2742 ❂ CIRCLED OPEN CENTRE EIGHT POINTED STAR
で転写される[ 1] 。
❂
U+10A56
𐩖
KHAROSHTHI PUNCTUATION DANDA
ダンダ。カローシュティー文字における句点。
韻文では半詩節の終わり(パダ)を表す。
U+007C | VERTICAL LINE
(バーティカルバー )で転写される[ 1] 。
|
U+10A57
𐩗
KHAROSHTHI PUNCTUATION DOUBLE DANDA
カローシュティー文字において段落の終わりを表す記号。
韻文においてスタンザ (詩節)の終わりを表す。
U+2016 ‖ DOUBLE VERTICAL LINE
(双柱)で転写される[ 1] 。
‖
U+10A58
𐩘
KHAROSHTHI PUNCTUATION LINES
U+3030 〰 WAVY DASH
(波ダッシュ )で転写される[ 1] 。
〰
小分類
このブロックの小分類は「母音字」(Vowels )、「長音記号」(Length mark )、「各種記号」(Various signs )、「子音字」(Consonants )、「ヴィラーマ」(Virama )、「数字」(Digits )、「数値と分数」(Numbers and fractions )、「約物」(Punctuation )の8つとなっている[ 6] 。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
母音字(Vowels )
この小分類にはカローシュティー文字のうち、基本的な母音字が収録されている。
長音記号(Length mark )
この小分類にはカローシュティー文字のうち、母音を長母音として発音することを表す、文字幅を持たない結合記号 1文字のみが収録されている。
各種記号(Various signs )
この小分類にはカローシュティー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
子音字(Consonants )
この小分類にはカローシュティー文字のうち、基本的な子音字が収録されている。
ヴィラーマ(Virama )
この小分類にはカローシュティー文字のうち、ヴィラーマ (殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。
数字(Digits )
この小分類にはカローシュティー文字で用いられる固有の数字 が収録されている。
アラビア・インド数字 とは異なり、数字も通常の文字と同様に右横書き で書かれる。
数値と分数(Numbers and fractions )
この小分類にはカローシュティー文字のうち、位取り記法を取らない単位数字(Unicode上では10進数による位取り記法を取る"digit"とは区別され、"number"と呼ばれる)が収録されている。
約物(Punctuation )
この小分類にはカローシュティー文字で用いられる句読点 などの約物 類が収録されている。
文字コード
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
コードポイント[ a]
文字数
L2 ID
ドキュメント
4.1
U+10A00..10A03,10A05..10A06,10A0C..10A13,10A15..10A17,
10A19..10A33,10A38..10A3A,10A3F..10A47,10A50..10A58
65
L2/02-203
Andrew Glass (10 May 2002), Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised) (英語)
L2/02-424
Rick McGowan (20 November 2002), Supplementary Information to Accompany L2/02-203R2, Proposal to Encode Kharoshthi (英語)
11.0
U+10A34..10A35,10A48
3
L2/17-012
Andrew Glass; Stefan Baums (17 January 2017), Additional Characters for Kharoṣṭhī Script (英語)
^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
出典
^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Andrew Glass (2002年5月10日). “Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised) ” (英語). Unicode. 2025年5月8日閲覧。
^ a b c Andrew Glass, Stefan Baums (2017年1月17日). “Additional Characters for Kharoṣṭhī Script ” (英語). Unicode. 2025年5月8日閲覧。
^ IAST ではṛと表記される。
^ IAST ではḷと表記される。
^ "The Unicode Standard, Version 16.0 - U0300.pdf" (PDF) . The Unicode Standard (英語). 2024年11月5日閲覧 。
^ a b c "The Unicode Standard, Version 15.1 - U10A00.pdf" (PDF) . The Unicode Standard (英語). 2025年5月8日閲覧 。
関連項目