
【6日でできるPHP入門】HTMLと文字コード
PHPやHTMLを使ってWebサイトを作成するとき、「文字化けが起きて困った!」という経験はありませんか?
その原因の多くは文字コードにあります。コンピュータは、文字そのものではなく「番号(コード)」で文字を管理しています。Webページやプログラムで正しく文字を表示するには、この「文字コード」の仕組みを知ることが大切です。
ここでは、代表的な文字コードの種類や、Webで主流となっているUnicode(UTF-8)の特徴、HTMLでの指定方法などをわかりやすく解説します。

1.文字コードの基本
1.1. 文字コードとは
文字コードとは、「A」や「ア」などの文字を、コンピュータが扱える**番号(数値)**に変換したものです。文字コードが正しく合っていないと、文字化けの原因になります。
主な文字コードの比較表
種類 | 読み方 | 概要 |
---|---|---|
ASCII | アスキー | 英字・数字・記号など128文字。半角英数字のみ。 |
Shift-JIS | シフトジス | 日本語対応。WindowsやMS-DOS、macOSで多く使われてきた。 |
EUC | イーユーシー | UNIX環境で利用。中国語や韓国語にも対応。 |
Unicode | ユニコード | 世界中の文字を表現可能。Webで標準的に使用される文字コード。 |
1.2. 文字集合と符号化方式
文字集合(Character Set)とは、「使える文字」と「その文字に割り当てる番号」の集まりです。
例:Unicodeは世界中の文字とその番号を定めた巨大な文字集合です。

一方、符号化方式(Encoding)」は、「番号をどのようにデータ化するか」を定めるルールです。
代表的な符号化方式
- UTF-8 … Unicodeの符号化方式のひとつ。Webやメール、各種ソフトで広く使われる
- UTF-16 … Unicodeのもう一つの符号化方式。主に一部アプリやシステムで利用
用語 | 説明 |
---|---|
文字集合 | 文字と番号をまとめたセット(例:Unicodeなど) |
符号化方式 | 番号をどのようにコンピュータデータにするかの方法 |
UTF-8 | 世界標準のエンコーディング。ASCII互換で多言語対応 |
2.HTMLと文字コードの関係
2.1. HTMLでの文字コード指定
Webページで文字コードを正しく指定しないと、文字化けの原因になります。
HTMLでは<meta charset="UTF-8">
タグを使い、文字コード(エンコーディング)を明示するのが基本です。
<meta charset="UTF-8">
このタグをHTMLの<head>
内に記述すれば、ブラウザはUTF-8で解釈します。
2.2. 文字コード選択のポイントと実際
なぜUTF-8が主流なのか?
- 世界中の文字を一つの方式で表現できる。
- ほぼすべてのWebブラウザ・メール・ソフトで対応
- 既存のASCIIとも互換性がある
文字コード選択の注意点
シーン | 推奨する文字コード |
---|---|
Webサイト制作 | UTF-8 |
日本国内の古いシステム | Shift-JIS |
グローバルなデータ交換 | UTF-8 |
まとめ
WebページやPHPプログラムでは、文字コードの知識が不可欠です。
特にUnicode/UTF-8は「世界中どこでも通用する」標準であり、Web制作現場では事実上のデファクトスタンダードです。
文字コードの基本を押さえることで、文字化けなどのトラブルを防ぎ、より快適なWeb開発を実現しましょう。