La norme Unicode propose des exposants et des indices d'un certain nombre de caractères, y compris les chiffres arabes. Ces caractères permettent de représenter diverses formules mathématiques ou physiques sous forme de simple texte sans recourir à un langage de balisage comme HTML ou TEX.
Description
Les exposants les plus courants, ¹, ² et ³, existaient dans la norme ISO/CEI 8859-1 aux positions B9, B2 et B3 et furent par conséquent portés par la norme Unicode aux adresses U+00B9, U+00B2 et U+00B3. Les autres exposants et indices sont codés dans le bloc U+2070 à U+209F :
De U+2070 à U+2079, exposants de chiffres. Les caractères U+2072 et U+2073, attendus pour les chiffres 2 et 3, ne sont pas utilisés. Le caractère U+2071 n'est pas l'exposant du chiffre 1 mais celui de la lettre i en bas-de-casse.
De U+207A à U+207F, exposants de divers symboles, respectivement les symboles +, -, =, (, ) et la lettre n en bas-de-casse.
De U+2080 à U+2089, indices de chiffres. Tous sont représentés.
De U+208A à U+208E, indices de symboles, respectivement +, -, =, (et). Le caractère U+208F n'est pas utilisé.
De U+2090 à U+2094, indices des lettres a, e, o, x et ə, en bas-de-casse.
Les caractères U+2095 à U+209F ne sont pas utilisés.
Plusieurs autres lettres latines, grecques et cyrilliques en indice ou en exposant sont classées parmi les extensions phonétiques, de U+1D2C à U+1D6A (exposants a, b, d, e, γ, etc. ; indices i, r, u, v, β, etc.).
Tables
La première table ci-dessous présente uniquement les caractères U+2070 à U+209F :
La deuxième table ci-dessous fait précéder les caractères U+2070 à U+209F (et les autres exposants et indices codés dans ISO 8859-1 et dans Unicode) par la lettre X capitale afin de mettre en évidence les indices et les exposants :
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+00B0
X²
X³
X¹
U+02B0
Xʰ
Xʱ
Xʲ
Xʳ
Xʴ
Xʵ
Xʶ
Xʷ
Xʸ
U+02C0
Xˀ
Xˁ
U+02E0
Xˠ
Xˡ
Xˢ
Xˣ
Xˤ
U+1D20
Xᴬ
Xᴭ
Xᴮ
Xᴯ
U+1D30
Xᴰ
Xᴱ
Xᴲ
Xᴳ
Xᴴ
Xᴵ
Xᴶ
Xᴷ
Xᴸ
Xᴹ
Xᴺ
Xᴻ
Xᴼ
Xᴽ
Xᴾ
Xᴿ
U+1D40
Xᵀ
Xᵁ
Xᵂ
Xᵃ
Xᵄ
Xᵅ
Xᵆ
Xᵇ
Xᵈ
Xᵉ
Xᵊ
Xᵋ
Xᵌ
Xᵍ
Xᵎ
Xᵏ
U+1D50
Xᵐ
Xᵑ
Xᵒ
Xᵓ
Xᵔ
Xᵕ
Xᵖ
Xᵗ
Xᵘ
Xᵙ
Xᵚ
Xᵛ
Xᵜ
Xᵝ
Xᵞ
Xᵟ
U+1D60
Xᵠ
Xᵡ
Xᵢ
Xᵣ
Xᵤ
Xᵥ
Xᵦ
Xᵧ
Xᵨ
Xᵩ
Xᵪ
U+1D90
Xᶛ
Xᶜ
Xᶝ
Xᶞ
Xᶟ
U+1DA0
Xᶠ
Xᶡ
Xᶢ
Xᶣ
Xᶤ
Xᶥ
Xᶦ
Xᶧ
Xᶨ
Xᶩ
Xᶪ
Xᶫ
Xᶬ
Xᶭ
Xᶮ
Xᶯ
U+1DB0
Xᶰ
Xᶱ
Xᶲ
Xᶳ
Xᶴ
Xᶵ
Xᶶ
Xᶷ
Xᶸ
Xᶹ
Xᶺ
Xᶻ
Xᶼ
Xᶽ
Xᶾ
Xᶿ
U+2070
X⁰
Xⁱ
X⁴
X⁵
X⁶
X⁷
X⁸
X⁹
X⁺
X⁻
X⁼
X⁽
X⁾
Xⁿ
U+2080
X₀
X₁
X₂
X₃
X₄
X₅
X₆
X₇
X₈
X₉
X₊
X₋
X₌
X₍
X₎
U+2090
Xₐ
Xₑ
Xₒ
Xₓ
Xₔ
Xₕ
Xₖ
Xₗ
Xₘ
Xₙ
Xₚ
Xₛ
Xₜ
U+2C70
Xⱼ
Xⱽ
U+A770
Xꝰ
U+A7F0
Xꟸ
Xꟹ
Enfin, à titre de référence, la dernière table ci-dessous reprend la présentation précédente, mais en codant les indices et les exposants à l'aide des balises HTML <sup>...</sup> et <sub>...</sub> :
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+00B0
X2
X3
X1
U+2070
X0
Xi
X4
X5
X6
X7
X8
X9
X+
X−
X=
X(
X)
Xn
U+2080
X0
X1
X2
X3
X4
X5
X6
X7
X8
X9
X+
X−
X=
X(
X)
U+2090
Xa
Xe
Xo
Xx
Xə
Xh
Xk
Xl
Xm
Xn
Xp
Xs
Xt
Superscript IPA
The Latin Extended-F block was created for the remaining superscript IPA letters. They are supported by the free Gentium Plus and Andika fonts. Additional superscript characters for historical and para-IPA letters have been accepted for future versions of the Unicode Standard.
Consonant letters
The Unicode characters for superscript (modifier) IPA and extIPA consonant letters are as follows. The entire Latin Extended-F block is dedicated to superscript IPA. Characters for sounds with secondary articulation are set off in parentheses and placed below the base letters.
IPA and extIPA consonants, along with superscript variants and their Unicode code points
The Unicode characters for superscript (modifier) IPA vowel letters, plus a pair of extended letters ᵻ ᵿ found in English dictionaries, are as follows. Recently retired alternative letters such as ɩ ɷ are also supported; they are set off in parentheses and placed below the standard IPA letters:
IPA vowels and superscript variants
Front
Central
Back
Close
i ⁱ 2071 (ᶖ)
y ʸ 02B8 (ᴉ ᵎ) 1D4E
ɨ ᶤ 1DA4 (𝼚)
ʉ ᶶ 1DB6 (ꭒ ꭟ) AB5F
ɯ ᵚ 1D5A (ꝯ ꝰ) A770
u ᵘ 1D58 (ᴜ ᶸ) 1DB8 (ᶙ)
Near-close
ɪ ᶦ 1DA6 (ɩ ᶥ) 1DA5
ʏ 𐞲 107B2 (ᴥ ᵜ) 1D5C
(ᵻ ᶧ) 1DA7
(ᵿ)
(ω)
ʊ ᶷ 1DB7 (ɷ 𐞤) 107A4 (ᴝ ᵙ) 1D59
Close-mid
e ᵉ 1D49 (ᶒ)
ø 𐞢 107A2 (ᴖ ᵔ) 1D54
ɘ 𐞎 1078E (ᴇ)
ɵ ᶱ 1DB1 (ᴗ ᵕ) 1D55
ɤ 𐞑 10791 (ɂ)
o ᵒ 1D52 (𝼛)
Mid
ɚ ᵊ˞ 1D4A + 02DE
(ⱸ)
ə ᵊ 1D4A (ᶕ)
ǝ
(ⱻ)
ɝ ᶟ˞ 1D9F + 02DE
Open-mid
ɛ ᵋ 1D4B (ᶓ)
œ ꟹ A7F9 (ⱺ)
ɜ ᶟ 1D9F (ᴈ ᵌ) 1D4C (ᶔ)
ɞ 𐞏 1078F (ʚ)
ʌ ᶺ 1DBA (ⱥ)
ɔ ᵓ 1D53 (ᶗ)
Near-open
a ᵃ 1D43
æ 𐞃 10783 (ᶏ)
ɶ 𐞣 107A3 (ᴁ)
ɐ ᵄ 1D44 (ᴂ ᵆ) 1D46
ɑ ᵅ 1D45 (ᶐ)
ɒ ᶛ 1D9B (ᴀ)
Length marks
The two length marks are also supported:
Length marks
Long
Half-long
ː 𐞁 10781
ˑ 𐞂 10782
Notes et références
Notes
↑Superscript Modèle:Angbr IPA is composed of superscript c and a combiningcedilla, which should display properly in a good font. Superscript c was specifically requested for this purpose in Unicode proposal L2/03-180.
↑U+02C1ˁmodifier letter reversed glottal stop is the superscript variant of U+0295ʕlatin letter pharyngeal voiced fricative and is defined for IPA use. The similar character U+02E4ˤmodifier letter small reversed glottal stop is a reversed U+02C0ˀmodifier letter glottal stop, perhaps a gelded reversed question mark. Fonts are inconsistent in whether they look different and what the difference is.