PCやスマホ、IT機器では文字が表示されると思います。

この文字ですが、実はすべてに番号が割当てられています。

例えば、半角アルファベットのAならば65番、Bならば66番・・・といった感じです。
このように文字コードは「この文字は何番!」といった割当てルールのようなものです。

なので文字コードが違えばどうなるかというと・・・

「71の文字を表示します!」 → ァ

あれ?何で「ァ」?71番の文字は「G」なんだけど!!


このように、文字コードが違うということは、文字に割当てられている番号が違うということです。

文字コードは色々な種類があります。
Windows系でよく使われるShift JIS、UNIX系でよく使われるEUC、
(今ではUnicodeにとって変わられてきていますけど)
他にもJISや、7ビットで半角文字を表現するASCIIコードなどです。

もちろん、これ以外にもたくさんあります。

なので、例えばEUCコードで書かれた文書をShift JISとして表示したらどうなるか・・・
番号の割り当てが全然違うので文字化けして読めない、という事になります。

あと、最近主流になっているUnicodeですがいろんな符号化方式があります。
代表的なものがUTF-8やUTF-16、UTF-16LE、UTF-16BE等です。
Unicodeというと、Linux系のOSではUTF-8、Windows系ではUTF-16(LE)が
よく使われています。

このあたりは細かく書くとマニアックにになると思うので、いずれ機械があればw

今回はざっくりという事でこのあたりで・・・

文字コードの事を理解するには少なくともここの内容は知っておく必要があるので
一般的には需要があまりないかもしれないですね。。。
キーワード: 文字コード Unicode UTF-8 UTF-16 EUC ShiftJIS ASCII EBCDIK
コメント(0件)

 

■コメントを書く
タイトル
本文 *必須
お名前 *必須
メールアドレス
ホームページアドレス
削除パスワード*必須
コメントを削除する際に必要になります。
認証キー *必須 下の画像に表示されている数字をご記入下さい。
(画像は毎回変わります)