CSV
文字エンコーディング - CSV
文字エンコーディングは、文字や記号をコンピュータが処理できるバイト列に変換するための規則体系です。ASCIIやUTF-8などの国際標準から、Shift_JISやEUC-JPなどの日本語専用エンコーディング、各国固有のコードページまで多様な方式が存在します。現在はUnicodeを基盤としたUTF-8が世界標準として広く採用されていますが、レガシーシステムとの互換性維持のため、様々なエンコーディング方式の理解が依然として重要です。
文字コード
Unicode
UTF-8
文字セット
国際化
テキスト処理
code,slug,name,description,category,ianaName,mibEnum
utf-8,utf-8,UTF-8,Unicodeを1〜4バイトの可変長で表現する文字エンコーディングです。,Unicode系,UTF-8,106
utf-16,utf-16,UTF-16,Unicodeを16ビット単位で表現する文字エンコーディングです。,Unicode系,UTF-16,1015
utf-32,utf-32,UTF-32,Unicodeを固定長32ビット(4バイト)で表現する文字エンコーディングです。,Unicode系,UTF-32,1017
us-ascii,us-ascii,US-ASCII,7ビットで128文字を定義する基本的な文字エンコーディングです。,ASCII系,US-ASCII,3
iso-8859-1,iso-8859-1,ISO-8859-1 (Latin-1),西ヨーロッパ言語向けの8ビット文字エンコーディングです。,ISO-8859系,ISO-8859-1,4
iso-8859-2,iso-8859-2,ISO-8859-2 (Latin-2),中央ヨーロッパ言語向けの8ビット文字エンコーディングです。,ISO-8859系,ISO-8859-2,5
iso-8859-5,iso-8859-5,ISO-8859-5 (Cyrillic),キリル文字向けの8ビット文字エンコーディングです。,ISO-8859系,ISO-8859-5,8
iso-8859-7,iso-8859-7,ISO-8859-7 (Greek),現代ギリシャ語向けの8ビット文字エンコーディングです。,ISO-8859系,ISO-8859-7,10
iso-8859-15,iso-8859-15,ISO-8859-15 (Latin-9),ISO-8859-1の改訂版でユーロ記号を含む8ビット文字エンコーディングです。,ISO-8859系,ISO-8859-15,111
shift_jis,shift-jis,Shift_JIS,WindowsとMacintoshで標準的に使用される日本語文字エンコーディングです。,日本語,Shift_JIS,17
euc-jp,euc-jp,EUC-JP,Unix系システムで使用される日本語文字エンコーディングです。,日本語,EUC-JP,18
iso-2022-jp,iso-2022-jp,ISO-2022-JP,7ビット環境での日本語電子メール用エンコーディングです。,日本語,ISO-2022-JP,39
gb2312,gb2312,GB2312,中国簡体字の基本的な文字エンコーディングです。,中国語,GB2312,2025
gbk,gbk,GBK,GB2312を拡張した中国語文字エンコーディングです。,中国語,GBK,113
gb18030,gb18030,GB18030,中国の現行国家標準で、全てのUnicode文字を表現可能です。,中国語,GB18030,114
big5,big5,Big5,台湾・香港で使用される繁体字中国語文字エンコーディングです。,中国語,Big5,2026
euc-kr,euc-kr,EUC-KR,Unix系システムで使用される韓国語文字エンコーディングです。,韓国語,EUC-KR,38
iso-2022-kr,iso-2022-kr,ISO-2022-KR,7ビット環境での韓国語電子メール用エンコーディングです。,韓国語,ISO-2022-KR,37
koi8-r,koi8-r,KOI8-R,ロシア語キリル文字用の8ビット文字エンコーディングです。,キリル文字,KOI8-R,2084
koi8-u,koi8-u,KOI8-U,ウクライナ語キリル文字用の8ビット文字エンコーディングです。,キリル文字,KOI8-U,2088
windows-1252,windows-1252,Windows-1252,Microsoft Windowsで使用される西ヨーロッパ言語向け8ビットエンコーディングです。,Windowsコードページ,windows-1252,2252