YAML
世界の言語詳細データ - YAML
世界の言語詳細データは、Ethnologue等の言語学的研究に基づき、世界で話されている主要な言語について包括的な情報を提供するものです。各言語について、語族分類、使用される文字体系(スクリプト)、母語話者数(L1)、第二言語話者数(L2)、総話者数などの統計データを含みます。現在、世界には約7,000以上の言語が存在しますが、このデータセットでは特に話者数5,000万人以上の主要言語を中心に収録しています。言語研究、国際ビジネス、教育、翻訳サービスなど様々な分野で活用できます。
言語
語族
文字体系
話者数
言語学
多言語
国際コミュニケーション
- code: "1"
slug: "english"
name: "英語"
description: "世界で最も広く話されている言語で、国際共通語として機能しています。"
languageFamily: "インド・ヨーロッパ語族(ゲルマン語派)"
writingSystem: "ラテン文字"
totalSpeakers: 1520000000
nativeSpeakers: 380000000
secondLanguageSpeakers: 1140000000
- code: "2"
slug: "mandarin-chinese"
name: "標準中国語(北京語)"
description: "母語話者数世界最大の言語で、中国大陸・台湾・シンガポールで主に使用されています。"
languageFamily: "シノ・チベット語族(中国語派)"
writingSystem: "漢字(簡体字・繁体字)"
totalSpeakers: 1180000000
nativeSpeakers: 940000000
secondLanguageSpeakers: 240000000
- code: "3"
slug: "hindi"
name: "ヒンディー語"
description: "インドの主要言語で、インド・アーリア語派に属する言語です。"
languageFamily: "インド・ヨーロッパ語族(インド・アーリア語派)"
writingSystem: "デーヴァナーガリー文字"
totalSpeakers: 610000000
nativeSpeakers: 350000000
secondLanguageSpeakers: 260000000
- code: "4"
slug: "spanish"
name: "スペイン語"
description: "ロマンス語派の言語で、スペイン・中南米で広く使用されています。"
languageFamily: "インド・ヨーロッパ語族(ロマンス語派)"
writingSystem: "ラテン文字"
totalSpeakers: 560000000
nativeSpeakers: 490000000
secondLanguageSpeakers: 70000000
- code: "5"
slug: "french"
name: "フランス語"
description: "ロマンス語派の言語で、アフリカを中心に話者数が増加しています。"
languageFamily: "インド・ヨーロッパ語族(ロマンス語派)"
writingSystem: "ラテン文字"
totalSpeakers: 320000000
nativeSpeakers: 80000000
secondLanguageSpeakers: 240000000
- code: "6"
slug: "arabic"
name: "アラビア語"
description: "アフロ・アジア語族の言語で、中東・北アフリカで広く使用されています。"
languageFamily: "アフロ・アジア語族(セム語派)"
writingSystem: "アラビア文字"
totalSpeakers: 340000000
nativeSpeakers: 320000000
secondLanguageSpeakers: 20000000
- code: "7"
slug: "bengali"
name: "ベンガル語"
description: "インド・アーリア語派の言語で、バングラデシュとインド東部で使用されています。"
languageFamily: "インド・ヨーロッパ語族(インド・アーリア語派)"
writingSystem: "ベンガル文字"
totalSpeakers: 280000000
nativeSpeakers: 230000000
secondLanguageSpeakers: 50000000
- code: "8"
slug: "portuguese"
name: "ポルトガル語"
description: "ロマンス語派の言語で、ブラジルを含むポルトガル語圏で使用されています。"
languageFamily: "インド・ヨーロッパ語族(ロマンス語派)"
writingSystem: "ラテン文字"
totalSpeakers: 270000000
nativeSpeakers: 230000000
secondLanguageSpeakers: 40000000
- code: "9"
slug: "russian"
name: "ロシア語"
description: "スラブ語派の言語で、旧ソ連諸国で広く使用されています。"
languageFamily: "インド・ヨーロッパ語族(スラブ語派)"
writingSystem: "キリル文字"
totalSpeakers: 260000000
nativeSpeakers: 150000000
secondLanguageSpeakers: 110000000
- code: "10"
slug: "urdu"
name: "ウルドゥー語"
description: "インド・アーリア語派の言語で、パキスタンの国語です。"
languageFamily: "インド・ヨーロッパ語族(インド・アーリア語派)"
writingSystem: "ペルシア・アラビア文字"
totalSpeakers: 250000000
nativeSpeakers: 70000000
secondLanguageSpeakers: 180000000
- code: "11"
slug: "indonesian"
name: "インドネシア語"
description: "オーストロネシア語族の言語で、インドネシアの公用語です。"
languageFamily: "オーストロネシア語族"
writingSystem: "ラテン文字"
totalSpeakers: 250000000
nativeSpeakers: 40000000
secondLanguageSpeakers: 210000000
- code: "12"
slug: "german"
name: "ドイツ語"
description: "ゲルマン語派の言語で、中央ヨーロッパで広く使用されています。"
languageFamily: "インド・ヨーロッパ語族(ゲルマン語派)"
writingSystem: "ラテン文字"
totalSpeakers: 135000000
nativeSpeakers: 80000000
secondLanguageSpeakers: 55000000
- code: "13"
slug: "japanese"
name: "日本語"
description: "日本で使用される言語で、系統的には孤立した言語とされています。"
languageFamily: "日本語族(ジャポニック語族)"
writingSystem: "漢字・ひらがな・カタカナ"
totalSpeakers: 125000000
nativeSpeakers: 124000000
secondLanguageSpeakers: 1000000
- code: "14"
slug: "nigerian-pidgin"
name: "ナイジェリア・ピジン語"
description: "英語を基盤とするクレオール語で、ナイジェリアで広く使用されています。"
languageFamily: "英語系クレオール語"
writingSystem: "ラテン文字"
totalSpeakers: 120000000
nativeSpeakers: 5000000
secondLanguageSpeakers: 115000000
- code: "15"
slug: "egyptian-arabic"
name: "エジプト・アラビア語"
description: "アラビア語の方言の一つで、エジプトで広く使用されています。"
languageFamily: "アフロ・アジア語族(セム語派)"
writingSystem: "アラビア文字"
totalSpeakers: 120000000
nativeSpeakers: 100000000
secondLanguageSpeakers: 20000000
- code: "16"
slug: "marathi"
name: "マラーティー語"
description: "インドのアーリア語派の言語で、マハーラーシュトラ州で主に使用されています。"
languageFamily: "インド・ヨーロッパ語族(インド・アーリア語派)"
writingSystem: "デーヴァナーガリー文字"
totalSpeakers: 99000000
nativeSpeakers: 83000000
secondLanguageSpeakers: 16000000
- code: "17"
slug: "telugu"
name: "テルグ語"
description: "ドラヴィダ語族の言語で、インド南部で広く使用されています。"
languageFamily: "ドラヴィダ語族"
writingSystem: "テルグ文字"
totalSpeakers: 96000000
nativeSpeakers: 83000000
secondLanguageSpeakers: 13000000
- code: "18"
slug: "turkish"
name: "トルコ語"
description: "テュルク語族の言語で、トルコとキプロスで主に使用されています。"
languageFamily: "テュルク語族"
writingSystem: "ラテン文字"
totalSpeakers: 91000000
nativeSpeakers: 84000000
secondLanguageSpeakers: 7000000
- code: "19"
slug: "tamil"
name: "タミル語"
description: "ドラヴィダ語族の古典的言語で、インド南部とスリランカで使用されています。"
languageFamily: "ドラヴィダ語族"
writingSystem: "タミル文字"
totalSpeakers: 86000000
nativeSpeakers: 75000000
secondLanguageSpeakers: 11000000
- code: "20"
slug: "cantonese"
name: "広東語(カントン語)"
description: "中国語群の方言で、香港・マカオ・広東省で主に使用されています。"
languageFamily: "シノ・チベット語族(中国語派)"
writingSystem: "漢字"
totalSpeakers: 86000000
nativeSpeakers: 85000000
secondLanguageSpeakers: 1000000
- code: "21"
slug: "vietnamese"
name: "ベトナム語"
description: "オーストロアジア語族の言語で、ラテン文字を使用する東アジアの言語です。"
languageFamily: "オーストロアジア語族(ベト・ムオン語派)"
writingSystem: "ラテン文字(クオック・グー)"
totalSpeakers: 97000000
nativeSpeakers: 85000000
secondLanguageSpeakers: 12000000
- code: "22"
slug: "wu-chinese"
name: "呉語(上海語)"
description: "中国語群の方言で、上海を中心とした長江デルタ地域で使用されています。"
languageFamily: "シノ・チベット語族(中国語派)"
writingSystem: "漢字"
totalSpeakers: 83000000
nativeSpeakers: 83000000
secondLanguageSpeakers: 0
- code: "23"
slug: "tagalog"
name: "タガログ語(フィリピノ語)"
description: "オーストロネシア語族の言語で、フィリピンの公用語です。"
languageFamily: "オーストロネシア語族"
writingSystem: "ラテン文字"
totalSpeakers: 83000000
nativeSpeakers: 30000000
secondLanguageSpeakers: 53000000
- code: "24"
slug: "korean"
name: "韓国語・朝鮮語"
description: "朝鮮半島で使用される言語で、ハングルという独自の文字体系を持ちます。"
languageFamily: "朝鮮語族(孤立した言語)"
writingSystem: "ハングル"
totalSpeakers: 82000000
nativeSpeakers: 80000000
secondLanguageSpeakers: 2000000
- code: "25"
slug: "farsi"
name: "ペルシア語(ファルシ)"
description: "イランで使用されるインド・ヨーロッパ語族の言語です。"
languageFamily: "インド・ヨーロッパ語族(イラン語派)"
writingSystem: "ペルシア・アラビア文字"
totalSpeakers: 79000000
nativeSpeakers: 55000000
secondLanguageSpeakers: 24000000