JSON
文字エンコーディング - JSON
文字エンコーディングは、文字や記号をコンピュータが処理できるバイト列に変換するための規則体系です。ASCIIやUTF-8などの国際標準から、Shift_JISやEUC-JPなどの日本語専用エンコーディング、各国固有のコードページまで多様な方式が存在します。現在はUnicodeを基盤としたUTF-8が世界標準として広く採用されていますが、レガシーシステムとの互換性維持のため、様々なエンコーディング方式の理解が依然として重要です。
文字コード
Unicode
UTF-8
文字セット
国際化
テキスト処理
[
{
"code": "utf-8",
"slug": "utf-8",
"name": "UTF-8",
"description": "Unicodeを1〜4バイトの可変長で表現する文字エンコーディングです。",
"category": "Unicode系",
"ianaName": "UTF-8",
"mibEnum": 106
},
{
"code": "utf-16",
"slug": "utf-16",
"name": "UTF-16",
"description": "Unicodeを16ビット単位で表現する文字エンコーディングです。",
"category": "Unicode系",
"ianaName": "UTF-16",
"mibEnum": 1015
},
{
"code": "utf-32",
"slug": "utf-32",
"name": "UTF-32",
"description": "Unicodeを固定長32ビット(4バイト)で表現する文字エンコーディングです。",
"category": "Unicode系",
"ianaName": "UTF-32",
"mibEnum": 1017
},
{
"code": "us-ascii",
"slug": "us-ascii",
"name": "US-ASCII",
"description": "7ビットで128文字を定義する基本的な文字エンコーディングです。",
"category": "ASCII系",
"ianaName": "US-ASCII",
"mibEnum": 3
},
{
"code": "iso-8859-1",
"slug": "iso-8859-1",
"name": "ISO-8859-1 (Latin-1)",
"description": "西ヨーロッパ言語向けの8ビット文字エンコーディングです。",
"category": "ISO-8859系",
"ianaName": "ISO-8859-1",
"mibEnum": 4
},
{
"code": "iso-8859-2",
"slug": "iso-8859-2",
"name": "ISO-8859-2 (Latin-2)",
"description": "中央ヨーロッパ言語向けの8ビット文字エンコーディングです。",
"category": "ISO-8859系",
"ianaName": "ISO-8859-2",
"mibEnum": 5
},
{
"code": "iso-8859-5",
"slug": "iso-8859-5",
"name": "ISO-8859-5 (Cyrillic)",
"description": "キリル文字向けの8ビット文字エンコーディングです。",
"category": "ISO-8859系",
"ianaName": "ISO-8859-5",
"mibEnum": 8
},
{
"code": "iso-8859-7",
"slug": "iso-8859-7",
"name": "ISO-8859-7 (Greek)",
"description": "現代ギリシャ語向けの8ビット文字エンコーディングです。",
"category": "ISO-8859系",
"ianaName": "ISO-8859-7",
"mibEnum": 10
},
{
"code": "iso-8859-15",
"slug": "iso-8859-15",
"name": "ISO-8859-15 (Latin-9)",
"description": "ISO-8859-1の改訂版でユーロ記号を含む8ビット文字エンコーディングです。",
"category": "ISO-8859系",
"ianaName": "ISO-8859-15",
"mibEnum": 111
},
{
"code": "shift_jis",
"slug": "shift-jis",
"name": "Shift_JIS",
"description": "WindowsとMacintoshで標準的に使用される日本語文字エンコーディングです。",
"category": "日本語",
"ianaName": "Shift_JIS",
"mibEnum": 17
},
{
"code": "euc-jp",
"slug": "euc-jp",
"name": "EUC-JP",
"description": "Unix系システムで使用される日本語文字エンコーディングです。",
"category": "日本語",
"ianaName": "EUC-JP",
"mibEnum": 18
},
{
"code": "iso-2022-jp",
"slug": "iso-2022-jp",
"name": "ISO-2022-JP",
"description": "7ビット環境での日本語電子メール用エンコーディングです。",
"category": "日本語",
"ianaName": "ISO-2022-JP",
"mibEnum": 39
},
{
"code": "gb2312",
"slug": "gb2312",
"name": "GB2312",
"description": "中国簡体字の基本的な文字エンコーディングです。",
"category": "中国語",
"ianaName": "GB2312",
"mibEnum": 2025
},
{
"code": "gbk",
"slug": "gbk",
"name": "GBK",
"description": "GB2312を拡張した中国語文字エンコーディングです。",
"category": "中国語",
"ianaName": "GBK",
"mibEnum": 113
},
{
"code": "gb18030",
"slug": "gb18030",
"name": "GB18030",
"description": "中国の現行国家標準で、全てのUnicode文字を表現可能です。",
"category": "中国語",
"ianaName": "GB18030",
"mibEnum": 114
},
{
"code": "big5",
"slug": "big5",
"name": "Big5",
"description": "台湾・香港で使用される繁体字中国語文字エンコーディングです。",
"category": "中国語",
"ianaName": "Big5",
"mibEnum": 2026
},
{
"code": "euc-kr",
"slug": "euc-kr",
"name": "EUC-KR",
"description": "Unix系システムで使用される韓国語文字エンコーディングです。",
"category": "韓国語",
"ianaName": "EUC-KR",
"mibEnum": 38
},
{
"code": "iso-2022-kr",
"slug": "iso-2022-kr",
"name": "ISO-2022-KR",
"description": "7ビット環境での韓国語電子メール用エンコーディングです。",
"category": "韓国語",
"ianaName": "ISO-2022-KR",
"mibEnum": 37
},
{
"code": "koi8-r",
"slug": "koi8-r",
"name": "KOI8-R",
"description": "ロシア語キリル文字用の8ビット文字エンコーディングです。",
"category": "キリル文字",
"ianaName": "KOI8-R",
"mibEnum": 2084
},
{
"code": "koi8-u",
"slug": "koi8-u",
"name": "KOI8-U",
"description": "ウクライナ語キリル文字用の8ビット文字エンコーディングです。",
"category": "キリル文字",
"ianaName": "KOI8-U",
"mibEnum": 2088
},
{
"code": "windows-1252",
"slug": "windows-1252",
"name": "Windows-1252",
"description": "Microsoft Windowsで使用される西ヨーロッパ言語向け8ビットエンコーディングです。",
"category": "Windowsコードページ",
"ianaName": "windows-1252",
"mibEnum": 2252
}
]