Okapi Project   Web technological site for the beginner... Top

データ表現

文字の表現

コンピュータは1と0のビットの組み合わせで文字を表現しています。どの組み合わせをこういう文字とするという規格がたくさんあります。そのうちのいくつかをここで紹介します。

・JISコード
JISにより決められたコードで、数字、英字、カナ、その他の特殊記号があります。半角文字です。

・拡張2進化10進表記法(EBCDIC)
数字、英字、カナ、その他の特殊記号があります。主に汎用機で使用されるコードです。カナ文字は日本独自で追加したコードで、カナ文字を含むものを拡張EBCDICと呼ぶ場合があります。

・JIS漢字コード
漢字を表現するためのコードで、日本語の文字は種類が多いため2byteで表現されます。全角文字です。

・ASCII
出版社の名前ではありません。多くのコンピュータで使用される8bit文字です。

・EUC
UNIX 等で扱うためのコードで、様々な言語用があります。UNIX 内部で扱うコードですが外部とのやりとりにも使われます。

・unicode

2byteで表現し、1つの文字コード体系で多国語処理を可能にしようとするもので、世界の主要な言語の文字を収録しています。Java言語で主に使用されています。