JSON

文字エンコーディング - JSON

文字エンコーディングは、文字や記号をコンピュータが処理できるバイト列に変換するための規則体系です。ASCIIやUTF-8などの国際標準から、Shift_JISやEUC-JPなどの日本語専用エンコーディング、各国固有のコードページまで多様な方式が存在します。現在はUnicodeを基盤としたUTF-8が世界標準として広く採用されていますが、レガシーシステムとの互換性維持のため、様々なエンコーディング方式の理解が依然として重要です。

文字コード Unicode UTF-8 文字セット国際化テキスト処理

[
  {
    "code": "utf-8",
    "slug": "utf-8",
    "name": "UTF-8",
    "description": "Unicodeを1〜4バイトの可変長で表現する文字エンコーディングです。",
    "category": "Unicode系",
    "ianaName": "UTF-8",
    "mibEnum": 106
  },
  {
    "code": "utf-16",
    "slug": "utf-16",
    "name": "UTF-16",
    "description": "Unicodeを16ビット単位で表現する文字エンコーディングです。",
    "category": "Unicode系",
    "ianaName": "UTF-16",
    "mibEnum": 1015
  },
  {
    "code": "utf-32",
    "slug": "utf-32",
    "name": "UTF-32",
    "description": "Unicodeを固定長32ビット（4バイト）で表現する文字エンコーディングです。",
    "category": "Unicode系",
    "ianaName": "UTF-32",
    "mibEnum": 1017
  },
  {
    "code": "us-ascii",
    "slug": "us-ascii",
    "name": "US-ASCII",
    "description": "7ビットで128文字を定義する基本的な文字エンコーディングです。",
    "category": "ASCII系",
    "ianaName": "US-ASCII",
    "mibEnum": 3
  },
  {
    "code": "iso-8859-1",
    "slug": "iso-8859-1",
    "name": "ISO-8859-1 (Latin-1)",
    "description": "西ヨーロッパ言語向けの8ビット文字エンコーディングです。",
    "category": "ISO-8859系",
    "ianaName": "ISO-8859-1",
    "mibEnum": 4
  },
  {
    "code": "iso-8859-2",
    "slug": "iso-8859-2",
    "name": "ISO-8859-2 (Latin-2)",
    "description": "中央ヨーロッパ言語向けの8ビット文字エンコーディングです。",
    "category": "ISO-8859系",
    "ianaName": "ISO-8859-2",
    "mibEnum": 5
  },
  {
    "code": "iso-8859-5",
    "slug": "iso-8859-5",
    "name": "ISO-8859-5 (Cyrillic)",
    "description": "キリル文字向けの8ビット文字エンコーディングです。",
    "category": "ISO-8859系",
    "ianaName": "ISO-8859-5",
    "mibEnum": 8
  },
  {
    "code": "iso-8859-7",
    "slug": "iso-8859-7",
    "name": "ISO-8859-7 (Greek)",
    "description": "現代ギリシャ語向けの8ビット文字エンコーディングです。",
    "category": "ISO-8859系",
    "ianaName": "ISO-8859-7",
    "mibEnum": 10
  },
  {
    "code": "iso-8859-15",
    "slug": "iso-8859-15",
    "name": "ISO-8859-15 (Latin-9)",
    "description": "ISO-8859-1の改訂版でユーロ記号を含む8ビット文字エンコーディングです。",
    "category": "ISO-8859系",
    "ianaName": "ISO-8859-15",
    "mibEnum": 111
  },
  {
    "code": "shift_jis",
    "slug": "shift-jis",
    "name": "Shift_JIS",
    "description": "WindowsとMacintoshで標準的に使用される日本語文字エンコーディングです。",
    "category": "日本語",
    "ianaName": "Shift_JIS",
    "mibEnum": 17
  },
  {
    "code": "euc-jp",
    "slug": "euc-jp",
    "name": "EUC-JP",
    "description": "Unix系システムで使用される日本語文字エンコーディングです。",
    "category": "日本語",
    "ianaName": "EUC-JP",
    "mibEnum": 18
  },
  {
    "code": "iso-2022-jp",
    "slug": "iso-2022-jp",
    "name": "ISO-2022-JP",
    "description": "7ビット環境での日本語電子メール用エンコーディングです。",
    "category": "日本語",
    "ianaName": "ISO-2022-JP",
    "mibEnum": 39
  },
  {
    "code": "gb2312",
    "slug": "gb2312",
    "name": "GB2312",
    "description": "中国簡体字の基本的な文字エンコーディングです。",
    "category": "中国語",
    "ianaName": "GB2312",
    "mibEnum": 2025
  },
  {
    "code": "gbk",
    "slug": "gbk",
    "name": "GBK",
    "description": "GB2312を拡張した中国語文字エンコーディングです。",
    "category": "中国語",
    "ianaName": "GBK",
    "mibEnum": 113
  },
  {
    "code": "gb18030",
    "slug": "gb18030",
    "name": "GB18030",
    "description": "中国の現行国家標準で、全てのUnicode文字を表現可能です。",
    "category": "中国語",
    "ianaName": "GB18030",
    "mibEnum": 114
  },
  {
    "code": "big5",
    "slug": "big5",
    "name": "Big5",
    "description": "台湾・香港で使用される繁体字中国語文字エンコーディングです。",
    "category": "中国語",
    "ianaName": "Big5",
    "mibEnum": 2026
  },
  {
    "code": "euc-kr",
    "slug": "euc-kr",
    "name": "EUC-KR",
    "description": "Unix系システムで使用される韓国語文字エンコーディングです。",
    "category": "韓国語",
    "ianaName": "EUC-KR",
    "mibEnum": 38
  },
  {
    "code": "iso-2022-kr",
    "slug": "iso-2022-kr",
    "name": "ISO-2022-KR",
    "description": "7ビット環境での韓国語電子メール用エンコーディングです。",
    "category": "韓国語",
    "ianaName": "ISO-2022-KR",
    "mibEnum": 37
  },
  {
    "code": "koi8-r",
    "slug": "koi8-r",
    "name": "KOI8-R",
    "description": "ロシア語キリル文字用の8ビット文字エンコーディングです。",
    "category": "キリル文字",
    "ianaName": "KOI8-R",
    "mibEnum": 2084
  },
  {
    "code": "koi8-u",
    "slug": "koi8-u",
    "name": "KOI8-U",
    "description": "ウクライナ語キリル文字用の8ビット文字エンコーディングです。",
    "category": "キリル文字",
    "ianaName": "KOI8-U",
    "mibEnum": 2088
  },
  {
    "code": "windows-1252",
    "slug": "windows-1252",
    "name": "Windows-1252",
    "description": "Microsoft Windowsで使用される西ヨーロッパ言語向け8ビットエンコーディングです。",
    "category": "Windowsコードページ",
    "ianaName": "windows-1252",
    "mibEnum": 2252
  }
]