利用者:A perfect fool/文字に関する諸問題ウィキペディア日本語版では、UTF-8エンコードされたUnicodeを使用しています。しかしながら、多言語テキストの実現を目的としたUnicodeと言えども、全ての文字を網羅したフォントは、存在するとしても一般的ではありませんし、少なくとも、それを標準で添付しているOSは皆無に等しいでしょう。ですから、あなたのコンピュータの「文字コード表」に載っていても、一般的でない文字の使用は避けるべきです ― たとえ、それがUnicodeの一般の領域に割り当てられているものであっても。 機種依存文字に関しては、Suisuiさんの利用者:Suisui/機種依存文字テストページにリストアップされていますので、参考にして下さい。 ブラウザによっては表示できない文字
上記の文字は、Windows 2000に標準で添付されている「インターネット・エクスプローラ 5.0」(以下、IE5)では表示できないことを確認しています。同じOSの上でも、Netscape 7.1 や Opera 7.22 では表示することができます。インストールされているフォントや設定によって結果は異なるかも知れませんが。
問題がありそうな文字
形の似た文字
半角カタカナUTF-8エンコードしたUnicodeを使用しているウィキペディアでは、半角カタカナも比較的安全です。しかしながら、Shift_JISでは1バイトで表せるこれらの文字も、UTF-8では3バイトになり、利点は少ないでしょう。 Unicodeと従来の文字集合Unicodeと従来の文字集合の関係は一意なものではなく、幾つかの文字は環境によっては、異なる文字に変換されることが知られています。従って、ソフトウェアによっては、内部処理にUnicodeを使用していない場合などには、編集の前と保存の後とで、自動的に別のコードに変換されてしまうこともあるかも知れません。 シフトJIS 8160h「~」として知られているShift_JISの8160hの文字は、WindowsではU+FF5Eに、MacintoshではU+301Cに変換されます。 |
Portal di Ensiklopedia Dunia