基本拉丁字母 (Unicode區段)
基本拉丁字母(Basic Latin),又稱C0控制字符及基本拉丁字母(C0 Controls and Basic Latin),是Unicode標準下的首個Unicode區段,亦是唯一一個在UTF-8下,以單一字節編碼的區段。此區段包含ASCII編碼下所有字母與控制字符。該區段的範圍為U+0000..U+007F(共128個字元),包含C0控制字符、ASCII标点符号與規約符號、ASCII數字、英文字母中的大寫與小寫字母,以及一個控制字元。 基本拉丁字母區段內的字元Unicode標準的1.0版本起一直沿用至今,多年來未曾對此作出任何增減。[3]該區段在1.0版本的名稱為ASCII。[4] 字符表下表列出基本拉丁字母包含的所有字符[5]: 字符表
子標題「C0控制字符及基本拉丁字母」區段內包含六個子標題。[5] C0控制字符「C0控制字符」(C0 Controls,於1.0版本中稱為C0 ASCII控制符)乃繼承自ASCII及其他7位元及8位元編碼系統。C0控制字符的別名乃基於ISO/IEC 6429:1992標準而取。[5] ASCII標點及符號此子標題乃指標準標點字元、簡單數學運算子,以及比索符號($)、百分號、&符號、下劃線和管道符號等符號。[5] ASCII數字「ASCII數字」(ASCII Digits)子標題包含標準歐式數字字元1-9及0。[5] 大寫拉丁字母「大寫拉丁字母」(Uppercase Latin alphabet)子標題包含26個標準、無附加符號的大寫拉丁字母。[5] 小寫拉丁字母「小寫拉丁字母」(Lowercase Latin alphabet)子標題包含26個標準、無附加符號的小寫拉丁字母。[5] 控制字元「控制字元」(Control Character)子標題僅包含「刪除」字元。[5] 符號、字母與控制符數量下表列出C0控制字符及基本拉丁字母區段中,各子標題的字母、符號與控制符數量。
區塊
變體部份字元若跟從變體指示器(variant indicators),則會以標準化變體的定義生成。 區段內亦有一個為字元「0」定義、帶有短對角斜線的變體0︀(U+0030 DIGIT ZERO U+FE00 VS1)。[7][8] 12個字元可透過U+FE0E VS15或U+FE0F VS16以生成繪文字變體。[9][10][11][12]它們均為鍵帽基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是「文字樣式」,而VS16版本則為「繪文字樣式」。[8]
歷史以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程:
參見注釋參考資料
|
Portal di Ensiklopedia Dunia