トップ > 暮らし > 誰もが使えるもの(5)日本語が危ない
暮らし

誰もが使えるもの(5)日本語が危ない

亀井貴也2006/09/18
パソコンを使っていて、難しい漢字が変換できず困った事はありませんか?文字コードという規則が、海外で整理されたためです。
日本 Web NA
 パソコンを使っていて、例えば人名などの少し難しい漢字が変換できなくて困った事はありませんか?

 しかたないと思われているこの問題には、コンピューターで使う文字コードというそれぞれの文字に割り振られた規則の中で、元々その国で体系化され、整理されたものが使われなく、英語圏で、英語圏以外の文字の整理が行われた結果だという話を少し詳しく紹介したいと思います。

 コンピューターは主にアメリカで発達したため、アルファベットや数字などの1バイトしか使われないASCII(American Standard Code for Information Interchange)による発達がなされ、英語圏以外の言語をマルチバイトで使えるよう改良されてきました。

 単純に云えば、キー入力の際、半角/全角ボタンで、半角にした際の幅の狭い英数字や記号がASCIIにあたり、英語圏で使われる文字はこの半角1バイトで用が足りるのですが、漢字圏の中にある日本語や、アラビア語、ロシア語、それにフランス語、スペイン語、ポルトガル語、ドイツ語など、アルファベット表記では収まりきらない文字は、日本語で言えば全角の2バイトを使うマルチバイト文字と云われます。ファイル保存で、例えば、半角一文字のテキストを保存するとそのファイルは1バイト、全角一文字のテキストを保存するとそのファイルは2バイトになります。

 このようにASCIIだけで用が足りるアメリカとは違い、私たちは日本語を扱わなくてはならないため、かつての日本はコンピューター技術開発の際、日本語の文字コード化を積極的に取り組みましたが、民間主導だったためか、JISコード、シフトJISコード、EUCコードなど複数の文字コードが作られる結果ともなりました。

 この体系化は、読み、部位など日本語の伝統に沿った整理法が用いられ、その技術は同じ漢字圏である中国、韓国、北朝鮮、台湾などでも手本として活用され、自国言語の整理が行われてきました。

 コンピューターの世界普及に伴い、言語の国際化も議論され始め、国際標準化機構(ISO)が全世界の主要な文字を含んだ単一の文字集合UCS (Universal multi-octet coded Character Set)を1993年に制定され、ISO10646と呼ばれるもので、それまであった各国の国内規格との互換を考慮したものとして作られました。

 一方、国際市場を重視し始めたアメリカの有力コンピュータ企業は、同様の目的で、従来方式とは全く異なるUnicode(Ver.1.0)という文字集合を策定したため、国際標準一本化のため、ISOは当初の案を変更して新しい標準を制定する事になりました。

 その際、漢字圏である中国語、日本語、韓国語(頭文字を取ってCJKと称される)の漢字2万文字がUnicodeにより、各国で用いられている漢字コードから重複するものや意味、構造が同じものを統合し、整理されましたが、従来のJISコードとの変換ルールが存在しないとか、ソート時に従来の文字コードで想定されていたソートが保証されないなど、問題が多く、漢字文化の危機と捉えられ、議論された事もあります。

 言語の整理に関し、地域や国などでしっかり区分された情報を持たない欠点を持つUnicodeの尻ぬぐいを、インターネットの共有ファイルであるHTMLの規格として、「言語情報を明記すべき」とする事で、責任を押しつけられたとする意見もあります。

 検索サイトなどで、日本語検索をした際に、判断基準の文字コードに地域や国などの情報がないため、ロシア語ページがヒットするなどおかしな事が起こり、本来、文字コードからどの言語で書かれているかがわかるということの技術的なメリットが、Unicodeという悪い設計のために、世界中のコンピューターが余計な検索結果をヒットさせ、無駄にエネルギーを消費しているとする見方もあります。

 更には日本語が持つ多様な漢字文化が、コンピューターでは「葛飾」「鴎外」など簡略化された文字しか現されなかったり、難字とされる人名漢字などが文字コードから除外されてしまっている事から、簡略化された文字が正しい文字になりつつあるという「日本語の危機」もあるのです。

 「Unicodeに代わるより良い提案を世界に出した日本人が1人でもいるだろうか?」。1997年、丸山学芸図書から出版された『いま日本語が危ない〜文字コードの誤った国際化』の著者、太田昌孝さんが語られたように、ここでも「美しい日本」を顧みずアメリカの合理的な文化論に流された日本人の姿が見えるのかも知れません。

 著作権切れの日本近代古典文学をウェブ閲覧可能とする労力を払われている青空文庫が「正しい字とは何か」で書かれているように、戦後の字体簡略化が、その後の文字コード化での漢字文化の認識の揺れとなり、更には国際化で、使える文字の制限によるその再現の困難さの中で、電子テキスト作成が行われている実情が語られています。

 世界で最も難しく、それゆえ最も表現豊かな言語、日本語をどれほど使いこなせているか、「言葉の乱れ」と問題視する大人達が「美しい日本語」を大切にしているのかという問題なのでしょう。

参考ページ:
The Web KANZAKI : 日本語と文字コード

「誰もが使えるもの」まとめとして、次回は人にとっての情報の大切さを紹介したいと思います。

誰もが使えるもの(1)少子高齢社会にふさわしい製品とは
誰もが使えるもの(2)環境を問わない利用可能の必要性
誰もが使えるもの(3)判りやすさが使いやすさ誰もが使えるもの(4) 「美しい日本語」を伝えるために
◇ ◇ ◇

ご意見板

この記事についてのご意見をお送りください。
(書込みには会員IDとパスワードが必要です。)

メッセージはありません

下のリストは、この記事をもとにJanJanのすべての記事の中から「連想検索」した結果10本を表示しています。
もっと見たい場合や、他のサイトでの検索結果もごらんになるには右のボタンをクリックしてください。