ここは川俣晶のウェブサイトの[旧館]にあたります。[新館]としてオータム マガジン川俣晶の縁側があります。

JIS X 0213:2000に関する追加解説


最終更新: Mon Sep 12 15:31:11 2011


 この情報は、本書177ページ「2.2.5 JIS X 0208 第3水準、第4水準」を補足する説明である。


経緯

 JIS X 0213:2000が正式に決定した。名称としては、一時、JIS X 0208の改正として第3水準、第4水準が追加されるという情報もあり、本書では、「JIS X 0208 第3水準、第4水準」という表記を取っていた。しかし、最終的に、JIS X 0208は0208のまま残り、それに対する拡張としてJIS X 0213という別番号の別規格として決まった。一時は、JIS X 0213の制定により、JIS X 0212補助漢字を廃止するという情報もあったが、これは廃止されておらず、依然として規格として有効である。

概要

 JIS X 0213は、別名として第3水準、第4水準と呼ばれるもので、JIS X 0208を拡張する補完的な文字集合を規定する。JIS X 0208で利用できる文字の種類が少ないという社会的ニーズに応えるために制定されたものである。教科書で使用されるすべての文字を網羅したり、歯科医師用記号を収録するなど、実用性に重点が置かれているのが特徴といえる。

収録文字数の問題

 しかしながら、収録された文字のバリエーションが充分かというと、まだまだ不足であるという指摘も多い。収録文字種を制限している主要な原因は、シフトJISの空き領域に第3水準、第4水準を収録することを意図したためである。これにより、シフトJIS以外で使用する場合も、文字種類が、シフトJISの空き領域の数に制限される形になっている。

シフトJISの拡張と文字化け問題

 ここでいうシフトJISとは、JIS X 0208;1997で定義されるシフト符号化方式そのものである。つまり、機種依存文字はすべて存在しないという前提で、空き領域の数を計算している。これにより、現実的に既に存在する機種依存文字や外字を使った文書ファイルを、JIS X 0213対応システムに読み込ませると、文字化けが発生する。従来の機種依存文字を使った文書か、JIS X 0213を使ったシフトJIS文書かの自動判定を行う手段は存在しないため、文字化けのトラブルは確実に発生する。

 この問題があるため、JIS X 0213:2000の制定にあたっては、いずれのメーカーもJIS X 0213:2000には反対の立場を取ったと言われている。

 最終的に制定されたJIS X 0213:2000は、互換性に問題が生じる恐れのあるシフトJIS、EUC-JP、ISO-2022-JPへの第3水準、第4水準の拡張に関しては、規格の一部とはせず、参考扱いにするという妥協が図られている(注、ISO-2022-JPの拡張版は、ISO-2022-JP3と呼ばれ、RFCとするための作業中であると言われる)。これらの文字エンコーディングスキームで利用できないとしても、JIS X 0202(ISO-2022)の体系の中で利用する道は残されているが、パソコンの世界では事実上使用されない体系であるため、事実上、パソコンユーザーには使えない規格になったと言って良い。また、JIS X 0202(ISO-2022)の体系を採用している大型コンピュータなどのメーカーも、採用しないという意思表示をしているため、そういう意味でも、利用できない規格と言える。

 このように、業界全体からの採用しない、できないという意思表示が明確であるにも関わらず、それを強引にJIS規格として成立されたということに関しては、大いに疑問が残る。JIS規格に関する行政のあり方に問題があるのではないだろうか?

 どのメーカーも、現行のJIS X 0213:2000に対しては批判的であるが、文字の拡張そのものを否定しているわけではない。実際には、Unicode上での文字拡張を、どのメーカーも望んでいる。どのメーカーも、Unicode対応は進行途中だが、既にUnicodeへの投資をしてしまったところも多く、後戻りはできないのだ。また、過去の資産の継承という意味では、変換は、1回にしたいのが本音だ。従来のシフトJISから、JIS X 0213対応のシフトJISにしてから、更にUnicodeにするという2度手間は好まれない。直接、従来のシフトJISからUnicodeにステップアップする方がベターと言える。

JIS X 0213:2000とUnicode

 これに対して、JIS X 0213:2000をUnicodeで利用するためには、どんなハードルがあるのか。実は、JIS X 0213:2000に収録された文字の過半数はJIS X 0212補助漢字に含まれている文字と同じである。JIS X 0212補助漢字の文字は既にUnicodeに収録されているので、これらの文字は既にUnicodeで利用可能と言える。また、それ以外にも、同等と見なせる文字が既にUnicodeに収録されている例もあり、JIS X 0213:2000に収録された文字の多くは、既に利用可能と見なせる。残された文字に関しては、現在、UnicodeやISO-10646に対して登録の作業を行っていると言われるが、現時点(2000年2月)では、すべて意図通りに登録されるか確実にはなっていないようだ。


パソコンにおける日本語処理/文字コードハンドブック サポートページ目次に戻る

QUICK MENU: [新館] / [旧館] Official→ [表紙] [著作] [旧館] Private→ [鉄道] [模型] [3DCG] [音楽] [写真] [日記]


autumn banner
作成:川俣 晶
電子メールアドレス/ autumn@piedey.co.jp