【6日でできるPHP入門】HTMLと文字コード

PHPやHTMLを使ってWebサイトを作成するとき、「文字化けが起きて困った!」という経験はありませんか?
 その原因の多くは文字コードにあります。コンピュータは、文字そのものではなく「番号(コード)」で文字を管理しています。Webページやプログラムで正しく文字を表示するには、この「文字コード」の仕組みを知ることが大切です。
 ここでは、代表的な文字コードの種類や、Webで主流となっているUnicode(UTF-8)の特徴、HTMLでの指定方法などをわかりやすく解説します。

1.文字コードの基本

1.1. 文字コードとは

 文字コードとは、「A」や「ア」などの文字を、コンピュータが扱える**番号(数値)**に変換したものです。文字コードが正しく合っていないと、文字化けの原因になります。

主な文字コードの比較表

種類読み方概要
ASCIIアスキー英字・数字・記号など128文字。半角英数字のみ。
Shift-JISシフトジス日本語対応。WindowsやMS-DOS、macOSで多く使われてきた。
EUCイーユーシーUNIX環境で利用。中国語や韓国語にも対応。
Unicodeユニコード世界中の文字を表現可能。Webで標準的に使用される文字コード。

1.2. 文字集合と符号化方式

文字集合(Character Set)とは、「使える文字」と「その文字に割り当てる番号」の集まりです。
例:Unicodeは世界中の文字とその番号を定めた巨大な文字集合です。

一方、符号化方式(Encoding)」は、「番号をどのようにデータ化するか」を定めるルールです。

代表的な符号化方式

  • UTF-8 … Unicodeの符号化方式のひとつ。Webやメール、各種ソフトで広く使われる
  • UTF-16 … Unicodeのもう一つの符号化方式。主に一部アプリやシステムで利用
用語説明
文字集合文字と番号をまとめたセット(例:Unicodeなど)
符号化方式番号をどのようにコンピュータデータにするかの方法
UTF-8世界標準のエンコーディング。ASCII互換で多言語対応

2.HTMLと文字コードの関係

2.1. HTMLでの文字コード指定

Webページで文字コードを正しく指定しないと、文字化けの原因になります。
HTMLでは<meta charset="UTF-8">タグを使い、文字コード(エンコーディング)を明示するのが基本です。

<meta charset="UTF-8">

このタグをHTMLの<head>内に記述すれば、ブラウザはUTF-8で解釈します。

2.2. 文字コード選択のポイントと実際

なぜUTF-8が主流なのか?

  • 世界中の文字を一つの方式で表現できる。
  • ほぼすべてのWebブラウザ・メール・ソフトで対応
  • 既存のASCIIとも互換性がある

文字コード選択の注意点

シーン推奨する文字コード
Webサイト制作UTF-8
日本国内の古いシステムShift-JIS
グローバルなデータ交換UTF-8

まとめ

WebページやPHPプログラムでは、文字コードの知識が不可欠です。
 特にUnicode/UTF-8は「世界中どこでも通用する」標準であり、Web制作現場では事実上のデファクトスタンダードです。
文字コードの基本を押さえることで、文字化けなどのトラブルを防ぎ、より快適なWeb開発を実現しましょう。