YAML

文字エンコーディング - YAML

文字エンコーディングは、文字や記号をコンピュータが処理できるバイト列に変換するための規則体系です。ASCIIやUTF-8などの国際標準から、Shift_JISやEUC-JPなどの日本語専用エンコーディング、各国固有のコードページまで多様な方式が存在します。現在はUnicodeを基盤としたUTF-8が世界標準として広く採用されていますが、レガシーシステムとの互換性維持のため、様々なエンコーディング方式の理解が依然として重要です。

文字コード Unicode UTF-8 文字セット 国際化 テキスト処理
- code: "utf-8"
  slug: "utf-8"
  name: "UTF-8"
  description: "Unicodeを1〜4バイトの可変長で表現する文字エンコーディングです。"
  category: "Unicode系"
  ianaName: "UTF-8"
  mibEnum: 106
- code: "utf-16"
  slug: "utf-16"
  name: "UTF-16"
  description: "Unicodeを16ビット単位で表現する文字エンコーディングです。"
  category: "Unicode系"
  ianaName: "UTF-16"
  mibEnum: 1015
- code: "utf-32"
  slug: "utf-32"
  name: "UTF-32"
  description: "Unicodeを固定長32ビット(4バイト)で表現する文字エンコーディングです。"
  category: "Unicode系"
  ianaName: "UTF-32"
  mibEnum: 1017
- code: "us-ascii"
  slug: "us-ascii"
  name: "US-ASCII"
  description: "7ビットで128文字を定義する基本的な文字エンコーディングです。"
  category: "ASCII系"
  ianaName: "US-ASCII"
  mibEnum: 3
- code: "iso-8859-1"
  slug: "iso-8859-1"
  name: "ISO-8859-1 (Latin-1)"
  description: "西ヨーロッパ言語向けの8ビット文字エンコーディングです。"
  category: "ISO-8859系"
  ianaName: "ISO-8859-1"
  mibEnum: 4
- code: "iso-8859-2"
  slug: "iso-8859-2"
  name: "ISO-8859-2 (Latin-2)"
  description: "中央ヨーロッパ言語向けの8ビット文字エンコーディングです。"
  category: "ISO-8859系"
  ianaName: "ISO-8859-2"
  mibEnum: 5
- code: "iso-8859-5"
  slug: "iso-8859-5"
  name: "ISO-8859-5 (Cyrillic)"
  description: "キリル文字向けの8ビット文字エンコーディングです。"
  category: "ISO-8859系"
  ianaName: "ISO-8859-5"
  mibEnum: 8
- code: "iso-8859-7"
  slug: "iso-8859-7"
  name: "ISO-8859-7 (Greek)"
  description: "現代ギリシャ語向けの8ビット文字エンコーディングです。"
  category: "ISO-8859系"
  ianaName: "ISO-8859-7"
  mibEnum: 10
- code: "iso-8859-15"
  slug: "iso-8859-15"
  name: "ISO-8859-15 (Latin-9)"
  description: "ISO-8859-1の改訂版でユーロ記号を含む8ビット文字エンコーディングです。"
  category: "ISO-8859系"
  ianaName: "ISO-8859-15"
  mibEnum: 111
- code: "shift_jis"
  slug: "shift-jis"
  name: "Shift_JIS"
  description: "WindowsとMacintoshで標準的に使用される日本語文字エンコーディングです。"
  category: "日本語"
  ianaName: "Shift_JIS"
  mibEnum: 17
- code: "euc-jp"
  slug: "euc-jp"
  name: "EUC-JP"
  description: "Unix系システムで使用される日本語文字エンコーディングです。"
  category: "日本語"
  ianaName: "EUC-JP"
  mibEnum: 18
- code: "iso-2022-jp"
  slug: "iso-2022-jp"
  name: "ISO-2022-JP"
  description: "7ビット環境での日本語電子メール用エンコーディングです。"
  category: "日本語"
  ianaName: "ISO-2022-JP"
  mibEnum: 39
- code: "gb2312"
  slug: "gb2312"
  name: "GB2312"
  description: "中国簡体字の基本的な文字エンコーディングです。"
  category: "中国語"
  ianaName: "GB2312"
  mibEnum: 2025
- code: "gbk"
  slug: "gbk"
  name: "GBK"
  description: "GB2312を拡張した中国語文字エンコーディングです。"
  category: "中国語"
  ianaName: "GBK"
  mibEnum: 113
- code: "gb18030"
  slug: "gb18030"
  name: "GB18030"
  description: "中国の現行国家標準で、全てのUnicode文字を表現可能です。"
  category: "中国語"
  ianaName: "GB18030"
  mibEnum: 114
- code: "big5"
  slug: "big5"
  name: "Big5"
  description: "台湾・香港で使用される繁体字中国語文字エンコーディングです。"
  category: "中国語"
  ianaName: "Big5"
  mibEnum: 2026
- code: "euc-kr"
  slug: "euc-kr"
  name: "EUC-KR"
  description: "Unix系システムで使用される韓国語文字エンコーディングです。"
  category: "韓国語"
  ianaName: "EUC-KR"
  mibEnum: 38
- code: "iso-2022-kr"
  slug: "iso-2022-kr"
  name: "ISO-2022-KR"
  description: "7ビット環境での韓国語電子メール用エンコーディングです。"
  category: "韓国語"
  ianaName: "ISO-2022-KR"
  mibEnum: 37
- code: "koi8-r"
  slug: "koi8-r"
  name: "KOI8-R"
  description: "ロシア語キリル文字用の8ビット文字エンコーディングです。"
  category: "キリル文字"
  ianaName: "KOI8-R"
  mibEnum: 2084
- code: "koi8-u"
  slug: "koi8-u"
  name: "KOI8-U"
  description: "ウクライナ語キリル文字用の8ビット文字エンコーディングです。"
  category: "キリル文字"
  ianaName: "KOI8-U"
  mibEnum: 2088
- code: "windows-1252"
  slug: "windows-1252"
  name: "Windows-1252"
  description: "Microsoft Windowsで使用される西ヨーロッパ言語向け8ビットエンコーディングです。"
  category: "Windowsコードページ"
  ianaName: "windows-1252"
  mibEnum: 2252