SENSE SHARE
2012.12.04    2018.05.25

プログラムで扱う文字コードについて

プログラムで扱う文字コードについて

本記事の内容

文字コードってご存知ですか?
プログラムを書く上で、気にしなければならない重要なポイントです。
今回は文字コードについて簡単にご説明していきたいと思います。

文字コードとは


文字コードというのは、マルチバイトの文字をどのように扱うか、という取り決めです。

マルチバイトというのは、いわゆる全角文字と呼ばれているもので、
日本語のひらがなや漢字は、マルチバイトです。

これら全角文字は、コンピューターの世界では
特定のコードに割り当てられています。

例えば、ひらがなの「あ」は「82A0」というコードが割り当てられています。

この、割り当て対応表が、文字コード表です。

ただ、やっかいなことに
Windowsでは「Shift_JIS」というコード表
UNIX系のOSでは、「EUC-JP」というコード表
というように、文字コード表にはいくつも種類があり、
それぞれに使用されているものが違ったりします。

もし、Shift_JISで表現されたデータに
EUC-JPのコード表を当てはめたら…

いわゆる「文字化け」という現象が発生し
文字が?マークや、意味不明な文字の連続になってしまいます。

Webプログラミングでは、

  • ユーザーが入出力する画面環境の文字コード
  • プログラム処理の際に使用する文字コード
  • データベースに入出力する際の文字コード

など、複数のコード体系が混在しがちなため、
適切な変換処理を実装する必要があるのです。


講座では、知識ゼロからでも
分かりやすく、実践体験を用いて楽しくレクチャーしています。

興味のある方は、この機会にプログラミングを覚えてみませんか?
まずは無料のメルマガに、ぜひご登録を。

この記事があなたのお役に立てたなら、
いいね!クリックをお願いします!

この記事を読んだ人はこんな記事も読んでいます。