区域指示符 (英語:regional indicator symbols )是一组用以对ISO 3166-1二位字母代码 标准的二字母國家地區代碼 进行编码的26个Unicode 字符。这种编码允许对于特定地区的符号进行特殊处理。
2010年10月,Unicode 6.0的发布为国家地区旗帜的繪文字 表示提供了区域指示符,作为「对每一面旗帜都进行编码」的替代方案。除了作为拉丁字母 显示外,这些符号的部分组合还可以在一些设备上渲染成符号对应的国家 或地区 的旗帜 。[ 1] [ 2] Unicode FAQ (页面存档备份 ,存于互联网档案馆 )表明,国家与地区的旗帜不会在Unicode中直接编码到单独的码位上去,而应当以此法编码。[ 3]
在Unicode编码中,这些符号位于U+1F1E6 🇦 REGIONAL INDICATOR SYMBOL LETTER A 与U+1F1FF 🇿 REGIONAL INDICATOR SYMBOL LETTER Z 之间,在第一辅助平面 的带圈字母数字补充区段 。[ 4]
绘文字旗帜列表
在一些系统中,旗帜的绘文字可能会显示为二位国家地区代码。[ 5]
一组区域指示符称为一个「绘文字旗帜序列」,虽然其代码代表的是地区而非旗帜。[ 6]
在所有的26 × 26 = 676个双字母组合中只有270个是合法的Unicode地区代码,包含了通用當地數據儲存庫 (CLDR)的以下子集:[ 6] [ 7] [ 8]
CLDR中全部的256个常规的地区代码序列
CLDR中的两个宏观区域(macroregion)的代码序列(EU与UN)
CLDR中全部12个已弃用 的地区代码序列(仅作向前兼容用)
Unicode区段
带圈字母数字补充区段 [1] 的区域指示符部分
Unicode联盟官方码表 (页面存档备份 ,存于互联网档案馆 ) (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+1F1Ex
(U+1F100–U+1F1E5 已省略)
🇦
🇧
🇨
🇩
🇪
🇫
🇬
🇭
🇮
🇯
U+1F1Fx
🇰
🇱
🇲
🇳
🇴
🇵
🇶
🇷
🇸
🇹
🇺
🇻
🇼
🇽
🇾
🇿
Notes
1.^ 依据Unicode 13.0
背景
在2007年,Unicode收到了一份对于广泛使用的绘文字编码提案,这份提案上的绘文字主要出自日本通讯公司NTT DOCOMO 、KDDI 和软银集团 之手。[ 12] 提案中的符号包含了下列十面旗帜[ 13] : 中国 (🇨🇳)、 德国 (🇩🇪)、 西班牙 (🇪🇸)、 法國 (🇫🇷)、 英国 (🇬🇧)、 義大利 (🇮🇹)、 日本 (🇯🇵)、 韩国 (🇰🇷)、 俄羅斯 (🇷🇺)和 美国 (🇺🇸)。有观点认为,仅仅对于这十面旗帜编码这一做法包含偏见。[ 14] 一个被驳回的编码提案是,在保留旗帜的情况下,称它们为「绘文字兼容字符-n」(EMOJI COMPATIBILITY SYMBOL-n)并以标准「EC n」显示,而不展示它们代表的旗帜;[ 15] 另一个被驳回的提案为676种双字母组合中每一种都分配了码位,以ISO 3166 标准(如FR
代表法国 )或国家和地区顶级域 (如EU
代表欧盟 )与旗帜对应。[ 16]
最终被接受的方案添加了与拉丁字母相对应的26个字符以表示区域指示符,当其按照上文的序列出现时会呈现出对应的旗帜,同时为绘文字的扩充预留了空间以供后续添加。[ 2] 根据Unicode标准,“此类[区域指示符的]组合的主要目的是,为表情符号核心集合中使用的特定字符提供明确双向映射”(the main purpose of such [regional indicator symbol] pairs is to provide unambiguous roundtrip mappings to certain characters used in the emoji core sets )[ 17] ,此处特指以下十面国旗:[ 18] 🇨🇳、🇩🇪、🇪🇸、🇫🇷、🇬🇧、🇮🇹、🇯🇵、🇰🇷、🇷🇺和🇺🇸。
由于Unicode的区域指示符只提供地区代码、不提供旗帜,特定的系统可以采取不渲染字符的方式以避免引起非议。如在台湾问题 中,对于实际统治台湾地区 的台北政府 ,北京政府 拒绝承认,因此在中国大陆 的新闻媒体报道中,中华民国国旗 会被作马赛克 处理,而在大陆法律下的电子产品,「🇹🇼」也会显示为字符缺失或不作为旗帜显示。[ 19] [ 20]
参见
註釋
参考文献
^ Andrew West . What's new in Unicode 6.0 . Babelstone. [2014-08-18 ] . (原始内容存档 于2014-04-06).
^ 2.0 2.1 Michael Everson and Ken Whistler. N3727: Proposal to encode Regional Indicator Symbols in the UCS (PDF) . Working Group Document, ISO/IEC JTC1/SC2/WG2 and UTC. [2014-08-18 ] . (原始内容存档 (PDF) 于2015-07-31).
^ Unicode FAQ: Emoji and Dingbats . The Unicode Consortium. 2009-10-28 [2014-08-18 ] . (原始内容存档 于2014-07-26).
^ Enclosed Alphanumeric Supplement, Range 1F100 - 1F1FF, The Unicode Standard, Version 6.0 (PDF) . Unicode Consortium. 2010 [2014-08-18 ] . (原始内容存档 (PDF) 于2015-07-30).
^ Flags . emojipedia.com. [2020-02-04 ] . (原始内容存档 于2020-01-31).
^ 6.0 6.1 UTR #51: Unicode Emoji, Annex B: Valid Emoji Flag Sequences , Unicode Consortium web, 2020-02-11 [2020-07-11 ] , (原始内容 存档于2020-06-30)
^ UTR #35: Unicode Locale Data Markup Language (LDML), Validity Data . Unicode Consortium. [2020-07-11 ] . (原始内容存档 于2020-07-14).
^ CLDR v37 Region Validity Data . Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結 ]
^ UCD: Emoji Sequence Data for UTR #51 . Unicode Consortium. 2020-01-28 [2020-07-11 ] . (原始内容存档 于2024-03-27).
^ UTR #35: Unicode Locale Data Markup Language (LDML), Supplemental Metadata . Unicode Consortium. [2020-07-11 ] . (原始内容存档 于2020-07-11).
^ CLDR v37 Supplemental Metadata . Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結 ]
^ Momoi, Kat; Davis, Mark; Scherer, Markus. L2/07-257: Working Draft Proposal for Encoding Emoji Symbols . 2007-08-03 [2014-08-18 ] . (原始内容存档 于2014-07-12).
^ Unicode Mapping for Emoji with Reference to Japanese Carriers, AU/KDDI, DoCoMo, and Softbank (ZIP archive file format) . [2014-08-18 ] . (原始内容存档 于2015-07-31).
^ L2/09-114 N3607: Towards an encoding of symbol characters used as emoji (PDF) . 2009-04-06 [2014-08-18 ] . (原始内容存档 (PDF) 于2015-07-31).
^ INCITS/L2/09-304: Comments accompanying the U.S. negative vote on PDAM 8 to ISO/IEC 10646:2003 (SC2 N4078) (PDF) . 2009-08-15 [2014-08-18 ] . (原始内容存档 (PDF) 于2015-07-31).
^ Pentzlin, Karl. L2/08-305: Some suggestions about the encoding of national flags as requested by the Emoji proposal (PDF) . 2008-08-09 [2014-08-18 ] . (原始内容存档 (PDF) 于2015-05-01).
^ The Unicode Standard, Version 6.2, Chapter 15: Symbols (PDF) . Unicode, Inc. September 2012: 534 [2020-07-11 ] . ISBN 978-1-936213-07-8 . (原始内容存档 (PDF) 于2020-08-09).
^ Emoji Sources (plain text) . Unicode, Inc. 2013-12-17 [2014-08-18 ] . (原始内容存档 于2014-08-23).
^ 法制网 :数十家世界500强外企官网错误标识我国港澳台地区 专家建议依法处置错误标识中国领土行为 (页面存档备份 ,存于互联网档案馆 )
^ 港澳iOS 13中華民國國旗被「河蟹」消失無蹤 港網民議論 - 科技 . 中時新聞網 . 2019-10-08 [2023-05-24 ] . (原始内容 存档于2020-07-11) (中文(臺灣)) .
Unicode 码位 字符
處理
組合字符 使用 相關標準 相關主題
文字
欧洲文字Ⅰ 現代文字與儀式文字 欧洲文字Ⅱ 古代文字與其它文字 中东文字Ⅰ 現代文字與儀式文字 中东文字Ⅱ 古代文字 楔形文字與象形文字 南亞和中亞文字Ⅰ 印度官方文字 南亞和中亞文字II 其它現代文字 南亞和中亞文字Ⅲ 古代文字 南亞和中亞文字Ⅳ 其它歷史文字 东南亚文字 印尼和大洋洲文字 东亚文字 非洲文字 美洲文字
符号
標記系統 标点符号 字母数字符号 技术符号 数字 数学符号 绘文字与象形 其它符號
其它