字母顺序
字母順序 (alphabetical order),全稱字母表順序 ,簡稱字母序, 简单易用,是拉丁文字的傳統排检法。 英文的詞典、索引和詞表等都普遍採用字母順序,中文的新華字典和現代漢語詞典等許多辭書正文所採用的漢語拼音排檢法也屬於字母順序。[1] 字母順序排檢法具有悠久的歷史,其基本原則是根據單詞中的字母在字母表中的前後順序來決定單詞之間的順序。下文作較為全面的介紹,并根據中文的具體需要,增加《漢語拼音排序法》的内容。[2] 歷史這裏只作簡略介紹,詳細内容請參閲[3]。 据歷史記載,人類大概在距今三千多年前的埃及西部发明字母順序。但這種文字排序法在之後的幾個世紀內一直沒有受到重視。 學者們第一次有效地使用字母順序作為編目工具可能是在古代亞歷山大圖書館(建於公元前 300年左右)時期。其中的書卷按作者姓名首個字母的字母順序進行放置。 12世紀下半葉,字母順序作為諮詢的輔助工具開始進入西歐知識分子生活的主流,當時開發了字母工具來幫助傳教士分析聖經詞彙。字母顺序的采用是从记忆至上到书面作品至上的一種过渡。 1604年,第一本單語英語詞典Table Alphabeticall采用字母順序編排,現今的許多參考書和列表的條目排列都是基於這種順序。 基本規則每一個拉丁文字系統(例如英文)都擁有自己的字母表(alphabet),即一個用来书写該語言的有序字母集合[4]。現行國際標準ISO基本拉丁字母表(ISO basic Latin alphabet)是: 大寫字母集: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 小寫字母集: a b c d e f g h i j k l m n o p q r s t u v w x y z 判定兩個單詞(字符串)先後順序的基本規則 [5] [a]是:
上述幾個例子的綜合字母序是: alphabet, alphabetical, cat, dog, what, why. 輔助規則在實際排序中有時會出現基本規則未能涵盖的问题,包括大小寫字母、字母表之外的字符,或者需要根據語言習慣作相應調整的情形。這時就需要辅助规则[6]。 大小寫字母大小寫字母在排序時一般被看成是一樣的。但如果有需要,可以對只在大小寫字母方面有區別的字符串做合乎語言習俗的處理。通常是將大寫的排前,例如,漢語拼音方案的字母表:Aa Bb ... Zz。 又如,《牛津高階英漢雙解詞典》 中有這樣的詞條排列: MS, Ms, Msc. [7] 多詞字符串如果待排序的字符串含有多個詞(中間常用空格或連詞符號隔開),這時有兩種處理方法:
the, a, an如果一個短語以一個非常常見的冠詞如“the”、“a”或“an”開頭,則該詞有時會被忽略或移至短語的末尾。 例如,書名“The Shining”可能會被視為“Shining”或“Shining, The”,因此會出現在書名“Summer of Sam”之前。 然而,它也可以被簡單地視為 "The Shining" 而排在 "Summer of Sam"之後。 《牛津高階英漢雙解詞典》 有這樣的條目順序:“ official secret, the Official Secrets Act, officiate”。用的是前面的方法。 連字指兩個或多個字母合併為一個符號,例如英語中的 Æ 和 Œ。這種連字符號通常被視作字母是分開的,即Æ 和 Œ分別當作AE 和 CE,而 æther 就按照 aether 來參加排序。 改形字母對於修改了形狀的字母,不同的語言可能有不同的處理方法。例如,法語中把帶附加符號的字符都當作基本字符來排序,例如 rôle 當作role,排在 rock 和 rose中間。德語的「電話簿序」中,Ä, Ö, Ü當作 "ae", "oe", "ue" 來排序。西班牙語的Ñ作為一個單獨字母排在N之後. 非字母字符數字和標點符號等非字母字符也有不同處理方法,一種是把它們排在所有字母之前 (例如, 《牛津高階英漢雙解詞典》 有這樣的條目順序: “MP, MP3, MP3 player, MP4, MPEG”,把數字排在字母之前)。 另一種方法是按其讀音的對應詞語來處理,例如,1999 按英語 nineteen nighty-nine 的拼寫來排列。 漢語拼音排序法這是根據漢語拼音方案所采用的基本拉丁字母表的順序來排列漢字。[2] 中文的新華字典和現代漢語詞典等許多辭書的正文都用漢語拼音排檢法。 單個漢字的排序漢字的拼音排序步驟如下:[1]
將上面的例字綜合起來的拼音字母順序是 “工(gōng)力(lì) 媽(mā) 麻(má) 馬(mǎ) 罵(mà) 嗎(ma) 男(nán) 努(nǔ) 女(nǚ) 齊(qí) 員(yuán)”。 用漢語拼音字母排列漢語單字的詳細順序可參見新版新华字典 [8] 的“漢語拼音音節索引”(這是一個不帶聲調的音節順序列表) 或 现代汉语词典 [9] 的“音節表”(帶聲調的音節順序列表)。 拼音表達式完全相同的字,即聲韻調相同的完全同音字,通常是藉助筆劃排檢法來排序。 多字詞的排序含有多個字的單詞有兩種不同的排序方式可供選用 [10]。
注释
参见參考資料
外部連結 |
Portal di Ensiklopedia Dunia