ソグド文字(ソグドもじ、英語: Sogdian)は、Unicodeのブロックの一つ。
解説
かつて現在のウズベキスタン東部のサマルカンド、フェルガナやタジキスタン西部のパンジケントなどの中央アジアでペルシア系のソグド人に話されていた、インド・ヨーロッパ語族インド・イラン語派イラン語群のソグド語を表記するためのソグド文字のうち、6世紀以降に用いられた、文字同士が連結するものを収録している。ソグド文字はモンゴル文字などの祖先にあたる。
なお、ソグド文字には「正体(formal)」と呼ばれる書体と「草書体(cursive)」と呼ばれる書体があるが、Unicodeではいずれも本ブロックに符号位置を統合されており、Unicode公式の表に掲載されている代表的なグリフは「正体」スタイルに基づいている[1][2]。
ソグド文字は古ソグド文字から派生した文字体系であり、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類される。書字方向には横書きの場合と縦書きの場合とがあり、横書きの場合はアラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)でありる。縦書きの場合は文字が反時計回りに90度回転し、モンゴル文字などと同様に左から右へと行を送る(左縦書き)。単語毎に分かち書きをし、スペースで単語を区切る[2]。
アラビア文字のように単語内における位置(独立・語頭・語中・語末)によって字形が変化する。なお、文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることで、その字形を表現することができる。例えば字母aleph(U+10F30 𐼰
)の語中形は𐼰U+200D U+10F30 U+200D
の形で表すことができる。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(ソグド数字)を有している。
符号位置の順序はアラム文字の順序に従っている[3]。
Unicodeのバージョン11.0において初めて追加された。
収録文字
コード
|
文字
(独立形)
|
文字名(英語)
|
語頭形
|
語中形
|
語末形
|
用例・説明
|
ラテン文字転写
|
字母
|
U+10F30
|
𐼰
|
SOGDIAN LETTER ALEPH
|
𐼰
|
𐼰
|
𐼰
|
子音[ʔ]を表す。
|
ʾ
|
U+10F31
|
𐼱
|
SOGDIAN LETTER BETH
|
𐼱
|
𐼱
|
𐼱
|
子音[b]を表す。
筆記体ではyodhと同一の字形になるため、しばしば区別のため上部に点が付けられる[2]。
|
b
|
U+10F32
|
𐼲
|
SOGDIAN LETTER GIMEL
|
𐼲
|
𐼲
|
𐼲
|
子音[ɡ]を表す。
|
g
|
U+10F33
|
𐼳
|
SOGDIAN LETTER HE
|
𐼳
|
𐼳
|
𐼳
|
子音[h]を表す。
語末でのみ用いられるため、語頭形・語中形が存在しない[3]。
|
h
|
U+10F34
|
𐼴
|
SOGDIAN LETTER WAW
|
𐼴
|
𐼴
|
𐼴
|
子音[w]を表す。
|
w
|
U+10F35
|
𐼵
|
SOGDIAN LETTER ZAYIN
|
𐼵
|
𐼵
|
𐼵
|
子音[z]を表す。
|
z
|
U+10F36
|
𐼶
|
SOGDIAN LETTER HETH
|
𐼶
|
𐼶
|
𐼶
|
子音[ħ]を表す。
語頭形・語中形はgimelと同一の字形となる[2]。
|
ḥ
|
U+10F37
|
𐼷
|
SOGDIAN LETTER YODH
|
𐼷
|
𐼷
|
𐼷
|
子音[j]を表す。
筆記体ではbethと同一の字形になる[2]。
|
y
|
U+10F38
|
𐼸
|
SOGDIAN LETTER KAPH
|
𐼸
|
𐼸
|
𐼸
|
子音[k]を表す。
|
k
|
U+10F39
|
𐼹
|
SOGDIAN LETTER LAMEDH
|
𐼹
|
𐼹
|
𐼹
|
子音[l]を表す。
|
l
|
U+10F3A
|
𐼺
|
SOGDIAN LETTER MEM
|
𐼺
|
𐼺
|
𐼺
|
子音[m]を表す。
|
m
|
U+10F3B
|
𐼻
|
SOGDIAN LETTER NUN
|
𐼻
|
𐼻
|
𐼻
|
子音[n]を表す。
|
n
|
U+10F3C
|
𐼼
|
SOGDIAN LETTER SAMEKH
|
𐼼
|
𐼼
|
𐼼
|
子音[s]を表す。
|
s
|
U+10F3D
|
𐼽
|
SOGDIAN LETTER AYIN
|
𐼽
|
𐼽
|
𐼽
|
子音[ʕ]を表す。
アラム語のヘテログラム(英語版)(他の言語から借用されて一塊で表語文字のように扱われる文字列)ʿDでのみ使用される[1]。
|
ʿ
|
U+10F3E
|
𐼾
|
SOGDIAN LETTER PE
|
𐼾
|
𐼾
|
𐼾
|
子音[p]を表す。
|
p
|
U+10F3F
|
𐼿
|
SOGDIAN LETTER SADHE
|
𐼿
|
𐼿
|
𐼿
|
子音[sˤ]を表す。
|
ṣ
|
U+10F40
|
𐽀
|
SOGDIAN LETTER RESH-AYIN
|
𐽀
|
𐽀
|
𐽀
|
子音[r]或いは[ʕ]を表す。
|
r/ʿ
|
U+10F41
|
𐽁
|
SOGDIAN LETTER SHIN
|
𐽁
|
𐽁
|
𐽁
|
子音[ʃ]を表す。
|
š
|
U+10F42
|
𐽂
|
SOGDIAN LETTER TAW
|
𐽂
|
𐽂
|
𐽂
|
子音[t]を表す。
|
t
|
U+10F43
|
𐽃
|
SOGDIAN LETTER FETH
|
𐽃
|
𐽃
|
𐽃
|
子音[f]を表す[2]。
|
f
|
U+10F44
|
𐽄
|
SOGDIAN LETTER LESH
|
𐽄
|
𐽄
|
𐽄
|
子音[l]を表す[2]。
|
l
|
表音文字
|
U+10F45
|
𐽅
|
SOGDIAN INDEPENDENT SHIN
|
|
|
|
U+10F41 𐽁 SOGDIAN LETTER SHIN の異体字。中国語の所/suǒ/の転写に用いられた[2]。
|
š[2]
|
結合記号
|
U+10F46
|
𐽆
|
SOGDIAN COMBINING DOT BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̣
|
U+10F47
|
𐽇
|
SOGDIAN COMBINING TWO DOTS BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̤
|
U+10F48
|
𐽈
|
SOGDIAN COMBINING DOT ABOVE
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̇
|
U+10F49
|
𐽉
|
SOGDIAN COMBINING TWO DOTS ABOVE
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̈
|
U+10F4A
|
𐽊
|
SOGDIAN COMBINING CURVE ABOVE
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[3]。
例えばtaw/t/に付いて/ṭ/を表す[3]。
|
̑
|
U+10F4B
|
𐽋
|
SOGDIAN COMBINING CURVE BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[3]。
例えば字母heth/ḥ/に付いて/h/を、resh/r/に付いて/l/を表す[3]。
|
̮
|
U+10F4C
|
𐽌
|
SOGDIAN COMBINING HOOK ABOVE
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̇
|
U+10F4D
|
𐽍
|
SOGDIAN COMBINING HOOK BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̣
|
U+10F4E
|
𐽎
|
SOGDIAN COMBINING LONG HOOK BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̣
|
U+10F4F
|
𐽏
|
SOGDIAN COMBINING RESH BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̣
|
U+10F50
|
𐽐
|
SOGDIAN COMBINING STROKE BELOW
|
|
|
|
外来語などにおいて字母の異音を表し、子音が変化したことを表す[2]。
|
̣
|
数値
|
U+10F51
|
𐽑
|
SOGDIAN NUMBER ONE
|
𐽑
|
𐽑
|
𐽑
|
単位数字の1
|
|
U+10F52
|
𐽒
|
SOGDIAN NUMBER TEN
|
𐽒
|
𐽒
|
𐽒
|
単位数字の10
|
|
U+10F53
|
𐽓
|
SOGDIAN NUMBER TWENTY
|
𐽓
|
𐽓
|
𐽓
|
単位数字の20
|
|
U+10F54
|
𐽔
|
SOGDIAN NUMBER ONE HUNDRED
|
𐽔
|
𐽔
|
𐽔
|
単位数字の100
|
|
約物
|
U+10F55
|
𐽕
|
SOGDIAN PUNCTUATION TWO VERTICAL BARS
|
|
|
|
一般的な句読点であり、単語の境界、主要なセクションの終わり、テキスト全体など、様々な長さのテキストセグメントを区切るために使用される[2][3]。
|
|
U+10F56
|
𐽖
|
SOGDIAN PUNCTUATION TWO VERTICAL BARS WITH DOTS
|
|
|
|
|
U+10F57
|
𐽗
|
SOGDIAN PUNCTUATION CIRCLE WITH DOT
|
|
|
|
|
U+10F58
|
𐽘
|
SOGDIAN PUNCTUATION TWO CIRCLES WITH DOTS
|
|
|
|
|
U+10F59
|
𐽙
|
SOGDIAN PUNCTUATION HALF CIRCLE WITH DOT
|
|
|
|
テキストの終了を示す[3]。
|
|
小分類
このブロックの小分類は「字母」(Letters)、「表音文字」(Phonogram)、「結合記号」(Combining marks)、「数値」(Numbers)、「約物」(Punctuation)の5つとなっている[1]。
字母(Letters)
この小分類にはソグド文字のうち、基本的な字母が収録されている。
表音文字(Phonogram)
この小分類にはソグド文字のうち、なんちゃらかんちゃらが収録されている。
結合記号(Combining marks)
この小分類にはソグド文字のうち、他の字母に結合する、文字幅を持たない結合記号(ダイアクリティカルマーク)が収録されている。
数値(Numbers)
この小分類にはソグド文字のうち、位取り記数法を用いず、単位数字を並べて表現する数値記号(Unicode上では10進法の位取り記数法を用いる"digit"とは区別される)が収録されている。
約物(Punctuation)
この小分類にはソグド文字で用いられる句読点などの約物類が収録されている。
文字コード
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
|
コードポイント[a]
|
文字数
|
L2 ID
|
ドキュメント
|
11.0
|
U+10F30..10F59
|
42
|
L2/16-158
|
Anshuman Pandey (10 May 2016), Preliminary proposal to encode Sogdian in Unicode (英語)
|
L2/16-371
|
Anshuman Pandey (25 January 2017), Revised proposal to encode the Sogdian script (revised) (英語)
|
- ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
|
出典
- ^ a b c “The Unicode Standard, Version 15.1 - U10F30.pdf” (PDF). The Unicode Standard (英語). 2025年5月26日閲覧.
- ^ a b c d e f g h i j k l m n o p q r s Anshuman Pandey (2017年1月25日). “Revised proposal to encode the Sogdian script (revised)” (英語). Unicode. 2025年5月26日閲覧。
- ^ a b c d e f g h Anshuman Pandey (2016年5月10日). “Preliminary proposal to encode Sogdian in Unicode” (英語). Unicode. 2025年5月26日閲覧。
関連項目