TOML
文字エンコーディング方式 - TOML
文字エンコーディング方式は、コンピュータが文字をデジタルデータとして扱うための符号化規格です。ASCII、UTF-8、UTF-16、Shift_JIS、EUC-JPなど様々な方式があり、それぞれ異なる文字セット、バイト構造、互換性を持ちます。現代ではUTF-8が国際標準として広く採用されていますが、日本語環境では従来のShift_JISやEUC-JPも依然として使用されています。
文字エンコーディング
Unicode
UTF-8
ASCII
Shift_JIS
EUC-JP
文字コード
国際化
[[items]]
code = "ASCII"
slug = "ascii"
name = "ASCII"
description = "アメリカ標準情報交換符号。英数字と記号を7ビットで表現します。"
asciiCompatible = true
byteStructure = "固定長(1バイト、7ビット使用)"
japaneseSupport = false
maxCharacters = 128
usage = "legacy"
yearIntroduced = 1963
[[items]]
code = "UTF-8"
slug = "utf-8"
name = "UTF-8"
description = "Unicodeの可変長符号化形式。ASCII互換で世界中の文字を表現します。"
asciiCompatible = true
byteStructure = "可変長(1〜4バイト)"
japaneseSupport = true
maxCharacters = 1114112
usage = "standard"
yearIntroduced = 1993
[[items]]
code = "UTF-16"
slug = "utf-16"
name = "UTF-16"
description = "Unicodeの16ビット符号化形式。WindowsやJavaで広く使用されます。"
asciiCompatible = false
byteStructure = "可変長(2または4バイト)"
japaneseSupport = true
maxCharacters = 1114112
usage = "system"
yearIntroduced = 1996
[[items]]
code = "UTF-32"
slug = "utf-32"
name = "UTF-32"
description = "Unicodeの固定長32ビット符号化形式。内部処理用に使用されます。"
asciiCompatible = false
byteStructure = "固定長(4バイト)"
japaneseSupport = true
maxCharacters = 1114112
usage = "internal"
yearIntroduced = 1996
[[items]]
code = "Shift_JIS"
slug = "shift-jis"
name = "Shift_JIS"
description = "日本語のレガシーエンコーディング。Windowsで広く使用されていました。"
asciiCompatible = false
byteStructure = "可変長(1〜2バイト)"
japaneseSupport = true
maxCharacters = 10000
usage = "legacy"
yearIntroduced = 1978
[[items]]
code = "EUC-JP"
slug = "euc-jp"
name = "EUC-JP"
description = "Unix/Linuxで使用された日本語エンコーディング。ASCII互換です。"
asciiCompatible = true
byteStructure = "可変長(1〜3バイト)"
japaneseSupport = true
maxCharacters = 11000
usage = "legacy"
yearIntroduced = 1988
[[items]]
code = "ISO-2022-JP"
slug = "iso-2022-jp"
name = "ISO-2022-JP"
description = "7ビットエスケープシーケンス方式の日本語エンコーディング。メールで使用。"
asciiCompatible = true
byteStructure = "7ビット可変長(エスケープシーケンス使用)"
japaneseSupport = true
maxCharacters = 10000
usage = "legacy"
yearIntroduced = 1983
[[items]]
code = "GB2312"
slug = "gb2312"
name = "GB2312"
description = "中国語簡体字の国家標準エンコーディング。"
asciiCompatible = false
byteStructure = "可変長(1〜2バイト)"
japaneseSupport = false
maxCharacters = 7445
usage = "legacy"
yearIntroduced = 1980
[[items]]
code = "Big5"
slug = "big5"
name = "Big5"
description = "台湾・香港で使用される繁体字中国語のエンコーディング。"
asciiCompatible = false
byteStructure = "可変長(1〜2バイト)"
japaneseSupport = false
maxCharacters = 13000
usage = "legacy"
yearIntroduced = 1984
[[items]]
code = "Windows-1252"
slug = "windows-1252"
name = "Windows-1252"
description = "Windowsで使用される西欧言語用のエンコーディング。"
asciiCompatible = true
byteStructure = "固定長(1バイト)"
japaneseSupport = false
maxCharacters = 256
usage = "legacy"
yearIntroduced = 1992