HTML
文字エンコーディング方式 - HTML
文字エンコーディング方式は、コンピュータが文字をデジタルデータとして扱うための符号化規格です。ASCII、UTF-8、UTF-16、Shift_JIS、EUC-JPなど様々な方式があり、それぞれ異なる文字セット、バイト構造、互換性を持ちます。現代ではUTF-8が国際標準として広く採用されていますが、日本語環境では従来のShift_JISやEUC-JPも依然として使用されています。
文字エンコーディング
Unicode
UTF-8
ASCII
Shift_JIS
EUC-JP
文字コード
国際化
<table>
<thead><tr><th>code</th><th>slug</th><th>name</th><th>description</th><th>asciiCompatible</th><th>byteStructure</th><th>japaneseSupport</th><th>maxCharacters</th><th>usage</th><th>yearIntroduced</th></tr></thead>
<tbody><tr><td>ASCII</td><td>ascii</td><td>ASCII</td><td>アメリカ標準情報交換符号。英数字と記号を7ビットで表現します。</td><td>true</td><td>固定長(1バイト、7ビット使用)</td><td>false</td><td>128</td><td>legacy</td><td>1963</td></tr>
<tr><td>UTF-8</td><td>utf-8</td><td>UTF-8</td><td>Unicodeの可変長符号化形式。ASCII互換で世界中の文字を表現します。</td><td>true</td><td>可変長(1〜4バイト)</td><td>true</td><td>1114112</td><td>standard</td><td>1993</td></tr>
<tr><td>UTF-16</td><td>utf-16</td><td>UTF-16</td><td>Unicodeの16ビット符号化形式。WindowsやJavaで広く使用されます。</td><td>false</td><td>可変長(2または4バイト)</td><td>true</td><td>1114112</td><td>system</td><td>1996</td></tr>
<tr><td>UTF-32</td><td>utf-32</td><td>UTF-32</td><td>Unicodeの固定長32ビット符号化形式。内部処理用に使用されます。</td><td>false</td><td>固定長(4バイト)</td><td>true</td><td>1114112</td><td>internal</td><td>1996</td></tr>
<tr><td>Shift_JIS</td><td>shift-jis</td><td>Shift_JIS</td><td>日本語のレガシーエンコーディング。Windowsで広く使用されていました。</td><td>false</td><td>可変長(1〜2バイト)</td><td>true</td><td>10000</td><td>legacy</td><td>1978</td></tr>
<tr><td>EUC-JP</td><td>euc-jp</td><td>EUC-JP</td><td>Unix/Linuxで使用された日本語エンコーディング。ASCII互換です。</td><td>true</td><td>可変長(1〜3バイト)</td><td>true</td><td>11000</td><td>legacy</td><td>1988</td></tr>
<tr><td>ISO-2022-JP</td><td>iso-2022-jp</td><td>ISO-2022-JP</td><td>7ビットエスケープシーケンス方式の日本語エンコーディング。メールで使用。</td><td>true</td><td>7ビット可変長(エスケープシーケンス使用)</td><td>true</td><td>10000</td><td>legacy</td><td>1983</td></tr>
<tr><td>GB2312</td><td>gb2312</td><td>GB2312</td><td>中国語簡体字の国家標準エンコーディング。</td><td>false</td><td>可変長(1〜2バイト)</td><td>false</td><td>7445</td><td>legacy</td><td>1980</td></tr>
<tr><td>Big5</td><td>big5</td><td>Big5</td><td>台湾・香港で使用される繁体字中国語のエンコーディング。</td><td>false</td><td>可変長(1〜2バイト)</td><td>false</td><td>13000</td><td>legacy</td><td>1984</td></tr>
<tr><td>Windows-1252</td><td>windows-1252</td><td>Windows-1252</td><td>Windowsで使用される西欧言語用のエンコーディング。</td><td>true</td><td>固定長(1バイト)</td><td>false</td><td>256</td><td>legacy</td><td>1992</td></tr></tbody>
</table>