シンハラ文字 (シンハラもじ、英語 : Sinhala )は、Unicode の32個目のブロック 。
解説
インド洋 に浮かぶ島国スリランカ の公用語である、インド・ヨーロッパ語族 インド・アーリア語派 のシンハラ語 の表記に用いられるシンハラ文字 を収録している。
シンハラ文字はデーヴァナーガリー などの他の多くの南アジア の文字体系と同様に、ブラーフミー文字 から派生した所謂ブラーフミー系文字 (インド系文字)の一つであり、音素文字 のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダ に分類される。母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語 : half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるアル・ラクナ(al-lakuna) という記号を子音字の右上に付加したりする。
書字方向 はラテン文字 やキリル文字 などと同様に左から右へと横書き(左横書き )し、下に行を送り、単語毎に分かち書き をする。
子音字は有声音 と無声音 の弁別に加えて、有気音 であるか無気音であるかを区別する。通常のブラーフミー系文字にあるこれらの区別に加えて、シンハラ文字には前鼻音化 した有声破裂音にも独立した文字が割り当てられているため、各調音点における破裂音 には計5種類の子音字が存在する。また、母音字については母音の長短 によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っているが、インドの文字体系ではないため他のブラーフミー系文字と符号化の順序に互換性は無い。
加えて、アラビア文字 やタイ文字 などと同様に独自の数字体系(シンハラ数字)を有しているが、シンハラ文字においては占星術の記述に古典的に使用されたのみで、現在の通常の文章ではあまり用いられない。
Unicodeが登場する以前のシンハラ文字の文字コード 規格であるSLS 1134やISO/IEC 10646-1:1993 [ 1] などに由来する文字セット を元に、いくつかのUnicode Consortium 宛の提案文書由来の拡張文字が加えられている。Unicodeのバージョン3.0で初めて追加された。
収録文字
「ラテン文字 転写」の列はブラーフミー系文字のラテン文字への翻字 方式の一つであるISO 15919 (および一部はIAST )に従う。
コード
文字
文字名(英語)
用例・説明
ラテン文字転写
各種記号
U+0D81
ඁ
SINHALA SIGN CANDRABINDU
アヌナーシカ、或いはチャンドラビンドゥ。
母音字や母音記号に付き、母音を鼻母音 で発音することを表す。
サンスクリット語 で用いられる。[ 2]
m̐
U+0D82
ං
SINHALA SIGN ANUSVARAYA
アヌスヴァーラ 、或いはビンドゥ。
直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。
ṁ
U+0D83
ඃ
SINHALA SIGN VISARGAYA
ヴィサルガ 。
音節末に[h ]を伴うことを表す。
ḥ
独立母音字
U+0D85
අ
SINHALA LETTER AYANNA
短母音[a ]を表す。
a
U+0D86
ආ
SINHALA LETTER AAYANNA
長母音[aː]を表す。
ā
U+0D87
ඇ
SINHALA LETTER AEYANNA
短母音[æ ]を表す。
æ
U+0D88
ඈ
SINHALA LETTER AEEYANNA
長母音[æː]を表す。
ǣ
U+0D89
ඉ
SINHALA LETTER IYANNA
短母音[i ]を表す。
i
U+0D8A
ඊ
SINHALA LETTER IIYANNA
長母音[iː]を表す。
ī
U+0D8B
උ
SINHALA LETTER UYANNA
短母音[u ]を表す。
u
U+0D8C
ඌ
SINHALA LETTER UUYANNA
長母音[uː]を表す。
ū
U+0D8D
ඍ
SINHALA LETTER IRUYANNA
音節主音 化した短母音としてのR(IPA :[r̩])を表す。
r̥[ 3]
U+0D8E
ඎ
SINHALA LETTER IRUUYANNA
音節主音 化した長母音としてのR(IPA :[r̩ː])を表す。
r̥̄[ 4]
U+0D8F
ඏ
SINHALA LETTER ILUYANNA
音節主音 化した短母音としてのL(IPA :[l̩])を表す。
l̥[ 5]
U+0D90
ඐ
SINHALA LETTER ILUUYANNA
音節主音 化した長母音としてのL(IPA :[l̩ː])を表す。
l̥̄[ 6]
U+0D91
එ
SINHALA LETTER EYANNA
短母音[e ]を表す。
e
U+0D92
ඒ
SINHALA LETTER EEYANNA
長母音[eː]を表す。
ē
U+0D93
ඓ
SINHALA LETTER AIYANNA
二重母音[aɪ]を表す。
ai
U+0D94
ඔ
SINHALA LETTER OYANNA
短母音[o ]を表す。
o
U+0D95
ඕ
SINHALA LETTER OOYANNA
長母音[oː]を表す。
ō
U+0D96
ඖ
SINHALA LETTER AUYANNA
二重母音[aʊ]を表す。
au
子音字
U+0D9A
ක
SINHALA LETTER ALPAPRAANA KAYANNA
子音[k ]を表す。
k
U+0D9B
ඛ
SINHALA LETTER MAHAAPRAANA KAYANNA
子音[kʰ]を表す。
kh
U+0D9C
ග
SINHALA LETTER ALPAPRAANA GAYANNA
子音[ɡ ]を表す。
g
U+0D9D
ඝ
SINHALA LETTER MAHAAPRAANA GAYANNA
子音[ɡʱ]を表す。
gh
U+0D9E
ඞ
SINHALA LETTER KANTAJA NAASIKYAYA
子音[ŋ ]を表す。
ṅ
U+0D9F
ඟ
SINHALA LETTER SANYAKA GAYANNA
前鼻音化 した子音[ᵑɡ]を表す。
n̆g
U+0DA0
ච
SINHALA LETTER ALPAPRAANA CAYANNA
子音[c ]を表す。
c
U+0DA1
ඡ
SINHALA LETTER MAHAAPRAANA CAYANNA
子音[cʰ]を表す。
ch
U+0DA2
ජ
SINHALA LETTER ALPAPRAANA JAYANNA
子音[ɟ ]を表す。
j
U+0DA3
ඣ
SINHALA LETTER MAHAAPRAANA JAYANNA
子音[ɟʱ]を表す。
jh
U+0DA4
ඤ
SINHALA LETTER TAALUJA NAASIKYAYA
子音[ɲ ]を表す。
ñ
U+0DA5
ඥ
SINHALA LETTER TAALUJA SANYOOGA NAAKSIKYAYA
子音列[ɟɲ]を表す。
jñ
U+0DA6
ඦ
SINHALA LETTER SANYAKA JAYANNA
前鼻音化 した子音[ⁿɟ]を表す。
n̆j
U+0DA7
ට
SINHALA LETTER ALPAPRAANA TTAYANNA
子音[ʈ ]を表す。
ṭ
U+0DA8
ඨ
SINHALA LETTER MAHAAPRAANA TTAYANNA
子音[ʈʰ]を表す。
ṭh
U+0DA9
ඩ
SINHALA LETTER ALPAPRAANA DDAYANNA
子音[ɖ ]を表す。
ḍ
U+0DAA
ඪ
SINHALA LETTER MAHAAPRAANA DDAYANNA
子音[ɖʱ]を表す。
ḍh
U+0DAB
ණ
SINHALA LETTER MUURDHAJA NAYANNA
子音[ɳ ]を表す。
ṇ
U+0DAC
ඬ
SINHALA LETTER SANYAKA DDAYANNA
前鼻音化 した子音[ᶯɖ]を表す。
n̆ḍ
U+0DAD
ත
SINHALA LETTER ALPAPRAANA TAYANNA
子音[t ]を表す。
t
U+0DAE
ථ
SINHALA LETTER MAHAAPRAANA TAYANNA
子音[tʰ]を表す。
th
U+0DAF
ද
SINHALA LETTER ALPAPRAANA DAYANNA
子音[d ]を表す。
d
U+0DB0
ධ
SINHALA LETTER MAHAAPRAANA DAYANNA
子音[dʱ]を表す。
dh
U+0DB1
න
SINHALA LETTER DANTAJA NAYANNA
子音[n ]を表す。
n
U+0DB2
(予約済)
ṉ
U+0DB3
ඳ
SINHALA LETTER SANYAKA DAYANNA
前鼻音化 した子音[ᶯd]を表す。
n̆d
U+0DB4
ප
SINHALA LETTER ALPAPRAANA PAYANNA
子音[p ]を表す。
p
U+0DB5
ඵ
SINHALA LETTER MAHAAPRAANA PAYANNA
子音[pʰ]を表す。
ph
U+0DB6
බ
SINHALA LETTER ALPAPRAANA BAYANNA
子音[b ]を表す。
b
U+0DB7
භ
SINHALA LETTER MAHAAPRAANA BAYANNA
子音[bʱ]を表す。
bh
U+0DB8
ම
SINHALA LETTER MAYANNA
子音[m ]を表す。
m
U+0DB9
ඹ
SINHALA LETTER AMBA BAYANNA
前鼻音化 した子音[ᵐb]を表す。
m̆b
U+0DBA
ය
SINHALA LETTER YAYANNA
子音[j ]を表す。
y
U+0DBB
ර
SINHALA LETTER RAYANNA
子音[r ]を表す。
r
U+0DBC
(予約済)
ṟ
U+0DBD
ල
SINHALA LETTER DANTAJA LAYANNA
子音[l ]を表す。
l
U+0DBE
(予約済)
ḷ
U+0DBF
(予約済)
ḻ
U+0DC0
ව
SINHALA LETTER VAYANNA
子音[ʋ ]を表す。
v
U+0DC1
ශ
SINHALA LETTER TAALUJA SAYANNA
子音[ɕ ]を表す。
ś
U+0DC2
ෂ
SINHALA LETTER MUURDHAJA SAYANNA
子音[ʂ ]を表す。
ṣ
U+0DC3
ස
SINHALA LETTER DANTAJA SAYANNA
子音[s ]を表す。
s
U+0DC4
හ
SINHALA LETTER HAYANNA
子音[h ]を表す。
h
U+0DC5
ළ
SINHALA LETTER MUURDHAJA LAYANNA
子音[ɭ ]を表す。
ḷ
U+0DC6
ෆ
SINHALA LETTER FAYANNA
子音[f ]を表す。
f
記号
U+0DCA
්
SINHALA SIGN AL-LAKUNA
アル・ラクナ(al-lakuna)[ 2] 、或いはヴィラーマ 。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。
レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にアル・ラクナ記号が子音字の上に書かれることもある。
従属母音記号
U+0DCF
ා
SINHALA VOWEL SIGN AELA-PILLA
長母音[aː]を表す。
ā
U+0DD0
ැ
SINHALA VOWEL SIGN KETTI AEDA-PILLA
短母音[æ ]を表す。
æ
U+0DD1
ෑ
SINHALA VOWEL SIGN DIGA AEDA-PILLA
長母音[æː]を表す。
ǣ
U+0DD2
ි
SINHALA VOWEL SIGN KETTI IS-PILLA
短母音[i ]を表す。
i
U+0DD3
ී
SINHALA VOWEL SIGN DIGA IS-PILLA
長母音[iː]を表す。
ī
U+0DD4
ු
SINHALA VOWEL SIGN KETTI PAA-PILLA
短母音[u ]を表す。
u
U+0DD5
(予約済)
U+0DD6
ූ
SINHALA VOWEL SIGN DIGA PAA-PILLA
長母音[uː]を表す。
ū
U+0DD7
(予約済)
U+0DD8
ෘ
SINHALA VOWEL SIGN GAETTA-PILLA
音節主音 化した短母音としてのR(IPA :[r̩])を表す。
r̥[ 3]
U+0DD9
ෙ
SINHALA VOWEL SIGN KOMBUVA
短母音[e ]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。
e
U+0DDA
ේ
SINHALA VOWEL SIGN DIGA KOMBUVA
長母音[eː]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。
ē
U+0DDB
ෛ
SINHALA VOWEL SIGN KOMBU DEKA
二重母音[aɪ]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。
ai
2要素からなる従属母音記号
U+0DDC
ො
SINHALA VOWEL SIGN KOMBUVA HAA AELA-PILLA
短母音[o ]を表す。
o
U+0DDD
ෝ
SINHALA VOWEL SIGN KOMBUVA HAA DIGA AELA-PILLA
長母音[oː]を表す。
ō
U+0DDE
ෞ
SINHALA VOWEL SIGN KOMBUVA HAA GAYANUKITTA
二重母音[aʊ]を表す。
au
従属母音記号
U+0DDF
ෟ
SINHALA VOWEL SIGN GAYANUKITTA
音節主音 化した短母音としてのL(IPA:[l̩])を表す。
l̥[ 5]
占星術用数字
U+0DE6
෦
SINHALA LITH DIGIT ZERO
シンハラ文字における数字の0 。
占星術 の記述にかつて用いられた。
0
U+0DE7
෧
SINHALA LITH DIGIT ONE
シンハラ文字における数字の1 。
占星術 の記述にかつて用いられた。
1
U+0DE8
෨
SINHALA LITH DIGIT TWO
シンハラ文字における数字の2 。
占星術 の記述にかつて用いられた。
2
U+0DE9
෩
SINHALA LITH DIGIT THREE
シンハラ文字における数字の3 。
占星術 の記述にかつて用いられた。
3
U+0DEA
෪
SINHALA LITH DIGIT FOUR
シンハラ文字における数字の4 。
占星術 の記述にかつて用いられた。
4
U+0DEB
෫
SINHALA LITH DIGIT FIVE
シンハラ文字における数字の5 。
占星術 の記述にかつて用いられた。
5
U+0DEC
෬
SINHALA LITH DIGIT SIX
シンハラ文字における数字の6 。
占星術 の記述にかつて用いられた。
6
U+0DED
෭
SINHALA LITH DIGIT SEVEN
シンハラ文字における数字の7 。
占星術 の記述にかつて用いられた。
7
U+0DEE
෮
SINHALA LITH DIGIT EIGHT
シンハラ文字における数字の8 。
占星術 の記述にかつて用いられた。
8
U+0DEF
෯
SINHALA LITH DIGIT NINE
シンハラ文字における数字の9 。
占星術 の記述にかつて用いられた。
9
追加の従属母音記号
U+0DF2
ෲ
SINHALA VOWEL SIGN DIGA GAETTA-PILLA
音節主音 化した長母音としてのR(IPA :[r̩ː])を表す。
r̥̄[ 4]
U+0DF3
ෳ
SINHALA VOWEL SIGN DIGA GAYANUKITTA
音節主音 化した長母音としてのL(IPA :[l̩ː])を表す。
l̥̄[ 6]
約物
U+0DF4
෴
SINHALA PUNCTUATION KUNDDALIYA
テキストの終端を表す。
小分類
このブロックの小分類は「各種記号」(Various signs )、「独立母音字」(Independent vowels )、「子音字」(Consonants )、「記号」(Sign )、「従属母音記号」(Dependent vowel signs )、「2要素からなる母音記号」(Two-part dependent vowel signs )、「占星術用数字」(Astrological digits )、「追加の従属母音記号」(Additional dependent vowel signs )、「約物」(Punctuation )の9個となっている[ 2] 。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs )
この小分類にはシンハラ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels )
この小分類にはシンハラ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants )
この小分類にはシンハラ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
記号(Sign )
この小分類にはシンハラ文字のうち、アル・ラクナ(al-lakuna) (殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字 として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
従属母音記号(Dependent vowel signs )
この小分類にはシンハラ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字 を形成することがある。
2要素からなる母音記号(Two-part dependent vowel signs )
これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[ 2]
占星術用数字(Astrological digits )
これらの数字 は、シンハラ・リス・イラカム(Sinhala Lith Illakkam)とも呼ばれ、主に占星術 の記述に用いられた。この数字体系には、111E1-111F4 の範囲でエンコードされているシンハラ語の古典的な数字、シンハラ・イラカム(Sinhala Illakkam)とは異なり、0のプレースホルダーの概念がある。[ 2]
追加の従属母音記号(Additional dependent vowel signs )
この小分類にはシンハラ文字のうち、サンスクリット語 に由来する音節主音 化した長母音としての流音 の母音記号が2つ収録されている。
約物(Punctuation )
この小分類にはシンハラ文字のうち、テキストの終端を表す約物 (句読点)1文字のみが収録されている。
文字コード
シンハラ文字 (Sinhala)[1] Official Unicode Consortium code chart (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+0D8x
ඁ
ං
ඃ
අ
ආ
ඇ
ඈ
ඉ
ඊ
උ
ඌ
ඍ
ඎ
ඏ
U+0D9x
ඐ
එ
ඒ
ඓ
ඔ
ඕ
ඖ
ක
ඛ
ග
ඝ
ඞ
ඟ
U+0DAx
ච
ඡ
ජ
ඣ
ඤ
ඥ
ඦ
ට
ඨ
ඩ
ඪ
ණ
ඬ
ත
ථ
ද
U+0DBx
ධ
න
ඳ
ප
ඵ
බ
භ
ම
ඹ
ය
ර
ල
U+0DCx
ව
ශ
ෂ
ස
හ
ළ
ෆ
්
ා
U+0DDx
ැ
ෑ
ි
ී
ු
ූ
ෘ
ෙ
ේ
ෛ
ො
ෝ
ෞ
ෟ
U+0DEx
෦
෧
෨
෩
෪
෫
෬
෭
෮
෯
U+0DFx
ෲ
ෳ
෴
注釈
1.^ バージョン15.1時点
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
コードポイント[ a]
文字数
L2 ID
ドキュメント
3.0
79
L2/04-131
Gihan Dias (15 April 2004), Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737) (英語)
7.0
U+0DE6-0DEF
10
L2/07-002
Michael Everson (12 January 2007), Proposal to add archaic numbers for Sinhala to the BMP (WG2 N3195) revised (英語)
L2/08-007
ICT / Sri Lanka (7 January 2008), Inclusion of archaic Sinhala numerals in the Sinhala character code range (英語)
L2/08-068
Gihan Dias (28 January 2008), Archaic Sinhala Numerals (英語)
L2/10-165
Gihan Dias (5 May 2010), Preliminary Proposal to Encode Sinhala Digits and Numerals (英語)
L2/08-105
Sri Lanka N.B. (5 February 2008), Observations on the Encoding of Archaic Sinhala Numerals in Unicode/UCS (英語)
L2/10-301
Ireland NB (9 August 2010), Proposal to add archaic numbers for Sinhala to the BMP and SMP (WG2 N3876) (英語)
L2/10-312
Gihan Dias (10 August 2010), Proposal to Encode Sinhala Archaic Numerals and Numbers (英語)
L2/10-337
SLSI (14 September 2010), Proposal to include Sinhala Numerals to the BMP and SMP (WG2 N3888) (英語)
L2/10-433
Harsha Wijayawardhana; Information and Communication Agency of Sri Lanka; SLSI (26 October 2010), Background information on the use of Sinhala Numerals (英語)
13.0
U+0D81
1
L2/18-060
Srinidhi A; Sridatta A (5 February 2018), Proposal to encode the CANDRABINDU for Sinhala (英語)
L2/18-079
Deborah Anderson (21 March 2018), Feedback on Sinhala candrabindu (L2/18-060) (英語)
L2/20-137
Gihan Dias (4 May 2020), Encoding of a character "Sinhala Chandrabindu" (英語)
^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
出典
^ Gihan Dias (2004年4月15日). “Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737) ” (英語). Unicode. 2024年8月8日閲覧。
^ a b c d e "The Unicode Standard, Version 15.1 - U0D80.pdf" (PDF) . The Unicode Standard (英語). 2024年8月8日閲覧 。
^ a b IAST ではṛと表記される。
^ a b IAST ではṝと表記される。
^ a b IAST ではḷと表記される。
^ a b IAST ではḹと表記される。
関連項目