古ソグド文字(こソグドもじ、英語: Old Sogdian)は、Unicodeのブロックの一つ。
解説
かつて現在のウズベキスタン東部のサマルカンド、フェルガナやタジキスタン西部のパンジケントなどの中央アジアでペルシア系のソグド人に話されていた、インド・ヨーロッパ語族インド・イラン語派イラン語群のソグド語を表記するためのソグド文字のうち、4世紀から5世紀にかけて用いられていた古ソグド文字を収録している。なお、本ブロックでは古代文字(Ancient Letters; 312年から314年の間に書かれた、中華人民共和国西部の敦煌で発見された紙に書かれた文書)とクルトベ(Kultobe; カザフスタンにあるテュルキスタンの遺跡)および上部インダス(Upper Indus; 4世紀から5世紀後半に書かれたパキスタンのギルギット地方にあるシャティアル(Shatial)などの遺跡で発見されたもの)の碑文で使用された文字が統合されている[1][2]。
古ソグド文字はアラム文字から派生した文字体系であり、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類される。アラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)であり、単語毎に分かち書きをする。ただし、上部インダス碑文の一部については縦書きで、文字を反時計回りに90度回転させ、モンゴル文字などと同様に行を左から右へ送る(左縦書き)ものも存在する[2]。Unicode上では右横書き文字として定義されている[3]。
アラビア文字や、6世紀以降用いられたソグド文字(Unicode上ではソグド文字ブロックに収録されている)とは異なり、ヘブライ文字のように文字同士は連結しない[2]。ヘブライ文字と同様にいくつかの子音字については語末のある場合の特殊な字形(語末形)が存在し、Unicodeでは符号位置を分けられている。語末形の一部には末尾が垂れさがった形状のもの(Unicode上では-WITH VERTICAL TAIL
という名前が付けられている)が存在するが、明確な使い分けの基準は判明していない[2]。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(古ソグド数字)を有している。
符号位置の順序はおおむね伝統的な古ソグド文字の順序に従っている。
Unicodeのバージョン11.0において初めて追加された。
収録文字
コード
|
文字
|
文字名(英語)
|
用例・説明
|
ラテン文字転写
|
字母
|
U+10F00
|
𐼀
|
OLD SOGDIAN LETTER ALEPH
|
子音[ʔ]を表す。
|
ʾ
|
U+10F01
|
𐼁
|
OLD SOGDIAN LETTER FINAL ALEPH
|
U+10F00の語末形。
|
U+10F02
|
𐼂
|
OLD SOGDIAN LETTER BETH
|
子音[b]を表す。
|
b
|
U+10F03
|
𐼃
|
OLD SOGDIAN LETTER FINAL BETH
|
U+10F02の語末形。
|
U+10F04
|
𐼄
|
OLD SOGDIAN LETTER GIMEL
|
子音[ɡ]を表す。
|
g
|
U+10F05
|
𐼅
|
OLD SOGDIAN LETTER HE
|
子音[h]を表す。
|
h
|
U+10F06
|
𐼆
|
OLD SOGDIAN LETTER FINAL HE
|
U+10F05の語末形。
|
U+10F07
|
𐼇
|
OLD SOGDIAN LETTER WAW
|
子音[w]を表す。
|
w
|
U+10F08
|
𐼈
|
OLD SOGDIAN LETTER ZAYIN
|
子音[z]を表す。
|
z
|
U+10F09
|
𐼉
|
OLD SOGDIAN LETTER HETH
|
子音[ħ]を表す。
|
ḥ
|
U+10F0A
|
𐼊
|
OLD SOGDIAN LETTER YODH
|
子音[j]を表す。
|
y
|
U+10F0B
|
𐼋
|
OLD SOGDIAN LETTER KAPH
|
子音[k]を表す。
|
k
|
U+10F0C
|
𐼌
|
OLD SOGDIAN LETTER LAMEDH
|
子音[l]を表す。
|
l
|
U+10F0D
|
𐼍
|
OLD SOGDIAN LETTER MEM
|
子音[m]を表す。
|
m
|
U+10F0E
|
𐼎
|
OLD SOGDIAN LETTER NUN
|
子音[n]を表す。
|
n
|
U+10F0F
|
𐼏
|
OLD SOGDIAN LETTER FINAL NUN
|
U+10F0Eの語末形。
|
U+10F10
|
𐼐
|
OLD SOGDIAN LETTER FINAL NUN WITH VERTICAL TAIL
|
U+10F0Eの語末形。U+10F0Fの異体字。
|
U+10F11
|
𐼑
|
OLD SOGDIAN LETTER SAMEKH
|
子音[s]を表す。
|
s
|
U+10F12
|
𐼒
|
OLD SOGDIAN LETTER AYIN
|
子音[ʕ]を表す。
アラム語のヘテログラム(英語版)(他の言語から借用されて一塊で表語文字のように扱われる文字列)ʿDでのみ使用される[1]。
ヘテログラム以外の用途ではU+10F18 𐼘 resh-ayin-dalethを用いる[1]。
|
ʿ
|
U+10F13
|
𐼓
|
OLD SOGDIAN LETTER ALTERNATE AYIN
|
U+10F12の異体字。
アラム語のヘテログラムʿDでのみ使用される[1]。
ヘテログラム以外の用途ではU+10F18 𐼘resh-ayin-dalethを用いる[1]。
|
U+10F14
|
𐼔
|
OLD SOGDIAN LETTER PE
|
子音[p]を表す。
|
p
|
U+10F15
|
𐼕
|
OLD SOGDIAN LETTER SADHE
|
子音[sˤ]を表す。
|
ṣ
|
U+10F16
|
𐼖
|
OLD SOGDIAN LETTER FINAL SADHE
|
U+10F15の語末形。
|
U+10F17
|
𐼗
|
OLD SOGDIAN LETTER FINAL SADHE WITH VERTICAL TAIL
|
U+10F15の語末形。U+10F16の異体字。
|
U+10F18
|
𐼘
|
OLD SOGDIAN LETTER RESH-AYIN-DALETH
|
子音[r]、[ʕ]及び[d]を表す。
アラム文字では別の字だったが字形が統合された。
|
r/ʿ/d
|
U+10F19
|
𐼙
|
OLD SOGDIAN LETTER SHIN
|
子音[ʃ]を表す。
|
š
|
U+10F1A
|
𐼚
|
OLD SOGDIAN LETTER TAW
|
子音[t]を表す。
|
t
|
U+10F1B
|
𐼛
|
OLD SOGDIAN LETTER FINAL TAW
|
U+10F1Aの語末形。
|
U+10F1C
|
𐼜
|
OLD SOGDIAN LETTER FINAL TAW WITH VERTICAL TAIL
|
U+10F1Aの語末形。U+10F1Bの異体字。
|
数値
|
U+10F1D
|
𐼝
|
OLD SOGDIAN NUMBER ONE
|
単位数字の1
|
|
U+10F1E
|
𐼞
|
OLD SOGDIAN NUMBER TWO
|
単位数字の2
|
|
U+10F1F
|
𐼟
|
OLD SOGDIAN NUMBER THREE
|
単位数字の3
|
|
U+10F20
|
𐼠
|
OLD SOGDIAN NUMBER FOUR
|
単位数字の4
|
|
U+10F21
|
𐼡
|
OLD SOGDIAN NUMBER FIVE
|
単位数字の5
|
|
U+10F22
|
𐼢
|
OLD SOGDIAN NUMBER TEN
|
単位数字の10
|
|
U+10F23
|
𐼣
|
OLD SOGDIAN NUMBER TWENTY
|
単位数字の20
|
|
U+10F24
|
𐼤
|
OLD SOGDIAN NUMBER THIRTY
|
単位数字の30
|
|
U+10F25
|
𐼥
|
OLD SOGDIAN NUMBER ONE HUNDRED
|
単位数字の100
|
|
U+10F26
|
𐼦
|
OLD SOGDIAN FRACTION ONE HALF
|
単位数字の1/2
|
|
合字
|
U+10F27
|
𐼧
|
OLD SOGDIAN LIGATURE AYIN-DALETH
|
アラム語のヘテログラムʿDを表す[1]。
|
|
小分類
このブロックの小分類は「字母」(Letters)、「数値」(Numbers)、「合字」(Ligature)の3つとなっている[1]。
字母(Letters)
この小分類には古ソグド文字のうち、基本的な字母が収録されている。
数値(Numbers)
この小分類には古ソグド文字のうち、位取り記数法を用いず、単位数字を並べて表現する数値記号(Unicode上では10進法の位取り記数法を用いる"digit"とは区別される)が収録されている。
合字(Ligature)
この小分類には古ソグド文字のうち、アラム語のヘテログラム(英語版)(他の言語から借用されて一塊で表語文字のように扱われる文字列)ʿDを表す[1]特殊な合字が収録されている。
文字コード
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
|
コードポイント[a]
|
文字数
|
L2 ID
|
ドキュメント
|
11.0
|
U+10F00..10F27
|
40
|
L2/16-312
|
Anshuman Pandey (25 January 2017), Proposal to encode the Old Sogdian script (revised) (英語)
|
- ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
|
出典
- ^ a b c d e f g h “The Unicode Standard, Version 15.1 - U10F00.pdf” (PDF). The Unicode Standard (英語). 2025年5月25日閲覧.
- ^ a b c d Anshuman Pandey (2017年1月25日). “Proposal to encode the Old Sogdian script (revised)” (英語). Unicode. 2025年5月26日閲覧。
- ^ “Roadmap to the SMP”. www.unicode.org. 2025年5月26日閲覧。
関連項目