カローシュティー文字 (Unicodeのブロック)

カローシュティー文字 (Unicodeのブロック)
Kharoshthi
範囲 U+10A00..U+10A5F
(96 個の符号位置)
追加多言語面
用字 カローシュティー文字
主な言語・文字体系
割当済 68 個の符号位置
未使用 28 個の保留
Unicodeのバージョン履歴
4.1 65 (+65)
11.0 68 (+3)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

カローシュティー文字(カローシュティーもじ、英語: Kharoshthi)は、Unicodeブロックの一つ。

解説

アショーカ王碑文などに見られる、紀元前250年から紀元後3世紀ごろにかけて、現在のパキスタン北部とアフガニスタン東部に存在していたガンダーラ王国で話されたプラークリット(中期インド語)の一種である、インド・ヨーロッパ語族インド・イラン語派インド語群に属するガンダーラ語や、サンスクリット[1]の表記に用いられたカローシュティー文字を収録している。

ガンダーラ地域では紀元3世紀頃には使われなくなったが、紀元後3世紀から4世紀にかけては、現在の中華人民共和国新疆ウイグル自治区にあたる中央アジアの都市ホータン及びニヤにおいて公文書や碑文にも使用され、北方シルクロード沿いのクチャとその周辺地域では7世紀まで残存していたと推測されている[1]

カローシュティー文字は南アジアの文字としては珍しくブラーフミー文字から派生した文字体系(ブラーフミー系文字)ではなく、アラム文字に由来していると考えられている[1]音素文字のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類されるが、アブギダとしては珍しくアラビア文字ヘブライ文字などと同様に右から左への横書き(右横書き)である。アラビア文字のような単語内位置による字形変化は存在しない。単語ごとの分かち書きは原則しないが、現代の学術的な慣習では分かち書き・ハイフネーションが行われる[1]。子音連続など子音のみで発音する場合はU+10A3F 𐨿 KHAROSHTHI VIRAMAヴィラーマ)という制御文字を用いて子音字同士の特殊な合字を形成する。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(カローシュティー数字)を有している。

カローシュティー文字にはArapacana(アラパチャナ)と呼ばれる伝統的な文字の並び順があるが、カローシュティー文字がUnicodeに追加申請された当初は文字の完全な順序の記録が発見されていなかったため、符号位置の順序は学術的慣習に基づいておおむねブラーフミー文字の順序に従っている[1]。なお、現在はArapacanaの完全な順序の記録が発見されているため、文字の正確なソート順序が判明している[2]

Unicodeのバージョン4.1において初めて追加された。

収録文字

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
母音字
U+10A00 𐨀 KHAROSHTHI LETTER A 短母音[a]を表す。

また、頭子音のない母音音節を表す子音字としても用いられる。

a
U+10A01 𐨁 KHAROSHTHI VOWEL SIGN I 短母音[i]を表す。

子音字a, n, hでは子音字を横切る横線として、th, p, ph, m, l, śでは縦線として、それ以外の文字ではUnicode公式の例示字形のように右肩上がりの斜めの線として書かれる[1]

i
U+10A02 𐨂 KHAROSHTHI VOWEL SIGN U 短母音[u]を表す。

子音字ṭ, hでは文字から離れた下付きの丸として、mでは特殊な合字(𐨨𐨂)を形成し、それ以外の文字では文字につながる下付きの丸として書かれる[1]

u
U+10A03 𐨃 KHAROSHTHI VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

子音字m, hでは文字から離されて書かれ、それ以外の文字では文字と重ねて書かれる[1]

[3]
U+10A04 (予約済み) [4]
U+10A05 𐨅 KHAROSHTHI VOWEL SIGN E 短母音[e]を表す。

子音字a, n, hでは子音字の右側に接する横線として、th, p, ph, m, l, śでは子音字の左上に接する縦線として、子音字d, mでは特殊な合字(𐨡𐨅, 𐨨𐨅)を形成し、それ以外の文字ではUnicode公式の例示字形のように上付きの右肩上がりの短い斜め線で書かれる[1]

e
U+10A06 𐨆 KHAROSHTHI VOWEL SIGN O 短母音[o]を表す。

子音字p, ph, y, śでは文字の中央下側に接する縦線として、それ以外の文字では文字の左下に接する右肩上がりの斜め線として書かれる[1]

o
長音記号
U+10A0C 𐨌 KHAROSHTHI VOWEL LENGTH MARK 母音を長母音として発音することを表す。

U+0304 ̄ COMBINING MACRONマクロン)で転写される[1]

̄
各種記号
U+10A0D 𐨍 KHAROSHTHI SIGN DOUBLE RING BELOW 中央アジアのいくつかの文書に見られるが、正確な発音価値はまだ確立されていない[1]

U+035A ͚ COMBINING DOUBLE RING BELOWで転写される[1][5]

͚
U+10A0E 𐨎 KHAROSHTHI SIGN ANUSVARA アヌスヴァーラ

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+10A0F 𐨏 KHAROSHTHI SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

子音字
U+10A10 𐨐 KHAROSHTHI LETTER KA 子音[k]を表す。 k
U+10A11 𐨑 KHAROSHTHI LETTER KHA 子音[kʰ]を表す。 kh
U+10A12 𐨒 KHAROSHTHI LETTER GA 子音[ɡ]を表す。 g
U+10A13 𐨓 KHAROSHTHI LETTER GHA 子音[ɡʱ]を表す。 gh
U+10A14 (予約済み)
U+10A15 𐨕 KHAROSHTHI LETTER CA 子音[c]を表す。 c
U+10A16 𐨖 KHAROSHTHI LETTER CHA 子音[cʰ]を表す。 ch
U+10A17 𐨗 KHAROSHTHI LETTER JA 子音[ɟ]を表す。 j
U+10A18 (予約済み) jh
U+10A19 𐨙 KHAROSHTHI LETTER NYA 子音[ɲ]を表す。 ñ
U+10A1A 𐨚 KHAROSHTHI LETTER TTA 子音[ʈ]を表す。
U+10A1B 𐨛 KHAROSHTHI LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+10A1C 𐨜 KHAROSHTHI LETTER DDA 子音[ɖ]を表す。
U+10A1D 𐨝 KHAROSHTHI LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+10A1E 𐨞 KHAROSHTHI LETTER NNA 子音[ɳ]を表す。
U+10A1F 𐨟 KHAROSHTHI LETTER TA 子音[t]を表す。 t
U+10A20 𐨠 KHAROSHTHI LETTER THA 子音[tʰ]を表す。 th
U+10A21 𐨡 KHAROSHTHI LETTER DA 子音[d]を表す。 d
U+10A22 𐨢 KHAROSHTHI LETTER DHA 子音[dʱ]を表す。 dh
U+10A23 𐨣 KHAROSHTHI LETTER NA 子音[n]を表す。 n
U+10A24 𐨤 KHAROSHTHI LETTER PA 子音[p]を表す。 p
U+10A25 𐨥 KHAROSHTHI LETTER PHA 子音[pʰ]を表す。 ph
U+10A26 𐨦 KHAROSHTHI LETTER BA 子音[b]を表す。 b
U+10A27 𐨧 KHAROSHTHI LETTER BHA 子音[bʱ]を表す。 bh
U+10A28 𐨨 KHAROSHTHI LETTER MA 子音[m]を表す。 m
U+10A29 𐨩 KHAROSHTHI LETTER YA 子音[j]を表す。 y
U+10A2A 𐨪 KHAROSHTHI LETTER RA 子音[r]を表す。 r
U+10A2B 𐨫 KHAROSHTHI LETTER LA 子音[l]を表す。 l
U+10A2C 𐨬 KHAROSHTHI LETTER VA 子音[ʋ]を表す。 v
U+10A2D 𐨭 KHAROSHTHI LETTER SHA 子音[ɕ]を表す。 ś
U+10A2E 𐨮 KHAROSHTHI LETTER SSA 子音[ʂ]を表す。
U+10A2F 𐨯 KHAROSHTHI LETTER SA 子音[s]を表す。 s
U+10A30 𐨰 KHAROSHTHI LETTER ZA 子音[z]を表す。 z
U+10A31 𐨱 KHAROSHTHI LETTER HA 子音[h]を表す。 h
U+10A32 𐨲 KHAROSHTHI LETTER KKA [1]
U+10A33 𐨳 KHAROSHTHI LETTER TTTHA ṭ́h[1]
U+10A34 𐨴 KHAROSHTHI LETTER TTTA ṭ́[2]
U+10A35 𐨵 KHAROSHTHI LETTER VHA 子音[ʋʱ]を表す。 vh[2]
各種記号
U+10A38 𐨸 KHAROSHTHI SIGN BAR ABOVE 鼻音化や有気音化など、関係する子音に応じてさまざまな発音の変更を示すために使用される[1]

U+0304 ̄ COMBINING MACRONマクロン)で転写される[1]

̄
U+10A39 𐨹 KHAROSHTHI SIGN CAUDA 関連する子音のさまざまな変形発音、特に摩擦音化を示すために使用される[1]

U+0301 ́ COMBINING ACUTE ACCENT鋭アクセント記号)で転写される[1]

́
U+10A3A 𐨺 KHAROSHTHI SIGN DOT BELOW 正確な発音価値はまだ確立されていない[1]

U+0323 ̣ COMBINING DOT BELOW(下付きドット符号)で転写される[1]

̣
ヴィラーマ
U+10A3F 𐨿 KHAROSHTHI VIRAMA ヴィラーマ。殺母音記号。暗黙の随伴母音/-a/を発音せず子音のみが読まれることを表す[6]

単独のグリフ形状は任意であり、レンダー上は前の文字を次の文字と繋げた合字を形成する[1]ための不可視の制御文字である[6]

数字
U+10A40 𐩀 KHAROSHTHI DIGIT ONE 数字の1 1
U+10A41 𐩁 KHAROSHTHI DIGIT TWO 数字の2 2
U+10A42 𐩂 KHAROSHTHI DIGIT THREE 数字の3 3
U+10A43 𐩃 KHAROSHTHI DIGIT FOUR 数字の4 4
数値と分数
U+10A44 𐩄 KHAROSHTHI NUMBER TEN 単位数字の10 10
U+10A45 𐩅 KHAROSHTHI NUMBER TWENTY 単位数字の20 20
U+10A46 𐩆 KHAROSHTHI NUMBER ONE HUNDRED 単位数字の100 100
U+10A47 𐩇 KHAROSHTHI NUMBER ONE THOUSAND 単位数字の1,000 1000
U+10A48 𐩈 KHAROSHTHI FRACTION ONE HALF 単位数字の1/2 ½
約物
U+10A50 𐩐 KHAROSHTHI PUNCTUATION DOT U+2022 • BULLETブレット)で転写される[1]
U+10A51 𐩑 KHAROSHTHI PUNCTUATION SMALL CIRCLE U+25E6 ◦ WHITE BULLETで転写される[1]
U+10A52 𐩒 KHAROSHTHI PUNCTUATION CIRCLE U+25CB ○ WHITE CIRCLE白丸)で転写される[1]
U+10A53 𐩓 KHAROSHTHI PUNCTUATION CRESCENT BAR U+2208 ∈ ELEMENT OFで転写される[1]
U+10A54 𐩔 KHAROSHTHI PUNCTUATION MANGALAM U+2295 ⊕ CIRCLED PLUSで転写される[1]
U+10A55 𐩕 KHAROSHTHI PUNCTUATION LOTUS U+2742 ❂ CIRCLED OPEN CENTRE EIGHT POINTED STARで転写される[1]
U+10A56 𐩖 KHAROSHTHI PUNCTUATION DANDA ダンダ。カローシュティー文字における句点。

韻文では半詩節の終わり(パダ)を表す。 U+007C | VERTICAL LINEバーティカルバー)で転写される[1]

|
U+10A57 𐩗 KHAROSHTHI PUNCTUATION DOUBLE DANDA カローシュティー文字において段落の終わりを表す記号。

韻文においてスタンザ(詩節)の終わりを表す。 U+2016 ‖ DOUBLE VERTICAL LINE(双柱)で転写される[1]

U+10A58 𐩘 KHAROSHTHI PUNCTUATION LINES U+3030 〰 WAVY DASH波ダッシュ)で転写される[1]

小分類

このブロックの小分類は「母音字」(Vowels)、「長音記号」(Length mark)、「各種記号」(Various signs)、「子音字」(Consonants)、「ヴィラーマ」(Virama)、「数字」(Digits)、「数値と分数」(Numbers and fractions)、「約物」(Punctuation)の8つとなっている[6]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

母音字(Vowels

この小分類にはカローシュティー文字のうち、基本的な母音字が収録されている。

長音記号(Length mark

この小分類にはカローシュティー文字のうち、母音を長母音として発音することを表す、文字幅を持たない結合記号1文字のみが収録されている。

各種記号(Various signs

この小分類にはカローシュティー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

子音字(Consonants

この小分類にはカローシュティー文字のうち、基本的な子音字が収録されている。

ヴィラーマ(Virama

この小分類にはカローシュティー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。

数字(Digits

この小分類にはカローシュティー文字で用いられる固有の数字が収録されている。

アラビア・インド数字とは異なり、数字も通常の文字と同様に右横書きで書かれる。

数値と分数(Numbers and fractions

この小分類にはカローシュティー文字のうち、位取り記法を取らない単位数字(Unicode上では10進数による位取り記法を取る"digit"とは区別され、"number"と呼ばれる)が収録されている。

約物(Punctuation

この小分類にはカローシュティー文字で用いられる句読点などの約物類が収録されている。

文字コード

カローシュティー文字(Kharoshthi)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+10A0x 𐨀 𐨁 𐨂 𐨃 𐨅 𐨆 𐨌 𐨍 𐨎 𐨏
U+10A1x 𐨐 𐨑 𐨒 𐨓 𐨕 𐨖 𐨗 𐨙 𐨚 𐨛 𐨜 𐨝 𐨞 𐨟
U+10A2x 𐨠 𐨡 𐨢 𐨣 𐨤 𐨥 𐨦 𐨧 𐨨 𐨩 𐨪 𐨫 𐨬 𐨭 𐨮 𐨯
U+10A3x 𐨰 𐨱 𐨲 𐨳 𐨴 𐨵 𐨸 𐨹 𐨺 𐨿
U+10A4x 𐩀 𐩁 𐩂 𐩃 𐩄 𐩅 𐩆 𐩇 𐩈
U+10A5x 𐩐 𐩑 𐩒 𐩓 𐩔 𐩕 𐩖 𐩗 𐩘
注釈
1.^バージョン16.0時点


履歴

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
4.1 U+10A00..10A03,10A05..10A06,10A0C..10A13,10A15..10A17,

10A19..10A33,10A38..10A3A,10A3F..10A47,10A50..10A58

65 L2/02-203 Andrew Glass (10 May 2002), Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised) (英語)
L2/02-424 Rick McGowan (20 November 2002), Supplementary Information to Accompany L2/02-203R2, Proposal to Encode Kharoshthi (英語)
11.0 U+10A34..10A35,10A48 3 L2/17-012 Andrew Glass; Stefan Baums (17 January 2017), Additional Characters for Kharoṣṭhī Script (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Andrew Glass (2002年5月10日). “Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised)” (英語). Unicode. 2025年5月8日閲覧。
  2. ^ a b c Andrew Glass, Stefan Baums (2017年1月17日). “Additional Characters for Kharoṣṭhī Script” (英語). Unicode. 2025年5月8日閲覧。
  3. ^ IASTではṛと表記される。
  4. ^ IASTではḷと表記される。
  5. ^ "The Unicode Standard, Version 16.0 - U0300.pdf" (PDF). The Unicode Standard (英語). 2024年11月5日閲覧
  6. ^ a b c "The Unicode Standard, Version 15.1 - U10A00.pdf" (PDF). The Unicode Standard (英語). 2025年5月8日閲覧

関連項目

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya