概要

世界の言語詳細データ

世界の言語詳細データは、Ethnologue等の言語学的研究に基づき、世界で話されている主要な言語について包括的な情報を提供するものです。各言語について、語族分類、使用される文字体系(スクリプト)、母語話者数(L1)、第二言語話者数(L2)、総話者数などの統計データを含みます。現在、世界には約7,000以上の言語が存在しますが、このデータセットでは特に話者数5,000万人以上の主要言語を中心に収録しています。言語研究、国際ビジネス、教育、翻訳サービスなど様々な分野で活用できます。

言語 語族 文字体系 話者数 言語学 多言語 国際コミュニケーション
コード スラッグ 名称 概要 languageFamily nativeSpeakers secondLanguageSpeakers totalSpeakers writingSystem
1 english 英語 世界で最も広く話されている言語で、国際共通語として機能しています。 インド・ヨーロッパ語族(ゲルマン語派) 380000000 1140000000 1520000000 ラテン文字
2 mandarin-chinese 標準中国語(北京語) 母語話者数世界最大の言語で、中国大陸・台湾・シンガポールで主に使用されています。 シノ・チベット語族(中国語派) 940000000 240000000 1180000000 漢字(簡体字・繁体字)
3 hindi ヒンディー語 インドの主要言語で、インド・アーリア語派に属する言語です。 インド・ヨーロッパ語族(インド・アーリア語派) 350000000 260000000 610000000 デーヴァナーガリー文字
4 spanish スペイン語 ロマンス語派の言語で、スペイン・中南米で広く使用されています。 インド・ヨーロッパ語族(ロマンス語派) 490000000 70000000 560000000 ラテン文字
5 french フランス語 ロマンス語派の言語で、アフリカを中心に話者数が増加しています。 インド・ヨーロッパ語族(ロマンス語派) 80000000 240000000 320000000 ラテン文字
6 arabic アラビア語 アフロ・アジア語族の言語で、中東・北アフリカで広く使用されています。 アフロ・アジア語族(セム語派) 320000000 20000000 340000000 アラビア文字
7 bengali ベンガル語 インド・アーリア語派の言語で、バングラデシュとインド東部で使用されています。 インド・ヨーロッパ語族(インド・アーリア語派) 230000000 50000000 280000000 ベンガル文字
8 portuguese ポルトガル語 ロマンス語派の言語で、ブラジルを含むポルトガル語圏で使用されています。 インド・ヨーロッパ語族(ロマンス語派) 230000000 40000000 270000000 ラテン文字
9 russian ロシア語 スラブ語派の言語で、旧ソ連諸国で広く使用されています。 インド・ヨーロッパ語族(スラブ語派) 150000000 110000000 260000000 キリル文字
10 urdu ウルドゥー語 インド・アーリア語派の言語で、パキスタンの国語です。 インド・ヨーロッパ語族(インド・アーリア語派) 70000000 180000000 250000000 ペルシア・アラビア文字
11 indonesian インドネシア語 オーストロネシア語族の言語で、インドネシアの公用語です。 オーストロネシア語族 40000000 210000000 250000000 ラテン文字
12 german ドイツ語 ゲルマン語派の言語で、中央ヨーロッパで広く使用されています。 インド・ヨーロッパ語族(ゲルマン語派) 80000000 55000000 135000000 ラテン文字
13 japanese 日本語 日本で使用される言語で、系統的には孤立した言語とされています。 日本語族(ジャポニック語族) 124000000 1000000 125000000 漢字・ひらがな・カタカナ
14 nigerian-pidgin ナイジェリア・ピジン語 英語を基盤とするクレオール語で、ナイジェリアで広く使用されています。 英語系クレオール語 5000000 115000000 120000000 ラテン文字
15 egyptian-arabic エジプト・アラビア語 アラビア語の方言の一つで、エジプトで広く使用されています。 アフロ・アジア語族(セム語派) 100000000 20000000 120000000 アラビア文字
16 marathi マラーティー語 インドのアーリア語派の言語で、マハーラーシュトラ州で主に使用されています。 インド・ヨーロッパ語族(インド・アーリア語派) 83000000 16000000 99000000 デーヴァナーガリー文字
17 telugu テルグ語 ドラヴィダ語族の言語で、インド南部で広く使用されています。 ドラヴィダ語族 83000000 13000000 96000000 テルグ文字
18 turkish トルコ語 テュルク語族の言語で、トルコとキプロスで主に使用されています。 テュルク語族 84000000 7000000 91000000 ラテン文字
19 tamil タミル語 ドラヴィダ語族の古典的言語で、インド南部とスリランカで使用されています。 ドラヴィダ語族 75000000 11000000 86000000 タミル文字
20 cantonese 広東語(カントン語) 中国語群の方言で、香港・マカオ・広東省で主に使用されています。 シノ・チベット語族(中国語派) 85000000 1000000 86000000 漢字
21 vietnamese ベトナム語 オーストロアジア語族の言語で、ラテン文字を使用する東アジアの言語です。 オーストロアジア語族(ベト・ムオン語派) 85000000 12000000 97000000 ラテン文字(クオック・グー)
22 wu-chinese 呉語(上海語) 中国語群の方言で、上海を中心とした長江デルタ地域で使用されています。 シノ・チベット語族(中国語派) 83000000 0 83000000 漢字
23 tagalog タガログ語(フィリピノ語) オーストロネシア語族の言語で、フィリピンの公用語です。 オーストロネシア語族 30000000 53000000 83000000 ラテン文字
24 korean 韓国語・朝鮮語 朝鮮半島で使用される言語で、ハングルという独自の文字体系を持ちます。 朝鮮語族(孤立した言語) 80000000 2000000 82000000 ハングル
25 farsi ペルシア語(ファルシ) イランで使用されるインド・ヨーロッパ語族の言語です。 インド・ヨーロッパ語族(イラン語派) 55000000 24000000 79000000 ペルシア・アラビア文字

世界には現在約7,000以上の言語が存在すると言われています。これらの言語はそれぞれ異なる語族に属し、独自の文字体系を持ち、異なる数の話者によって使用されています。話者数の多い言語を中心に見ていくと、言語の分布には興味深いパターンが見えてきます。

総話者数で見ると、英語が約15億人で世界最大となっています。ただし、英語の特徴は母語話者が約3.8億人と比較的少なく、第二言語話者が約11億人と圧倒的に多い点です。これはイギリスの植民地支配の歴史と、アメリカの経済・文化的影響の結果です。対照的に、母語話者数では標準中国語が約9.4億人で世界最大であり、中国の人口規模を反映しています。

語族の観点から見ると、インド・ヨーロッパ語族が最も広く分布しています。英語、スペイン語、ヒンディー語、フランス語、ドイツ語など、話者数の多い言語の多くがこの語族に属しています。特にロマンス語派(スペイン語、フランス語、ポルトガル語など)は、ローマ帝国の拡大とその後の植民地支配によって、ヨーロッパからアメリカ大陸、アフリカ、アジアに広がりました。

文字体系の多様性も注目に値します。ラテン文字は最も広く使用されており、英語、スペイン語、フランス語をはじめ、多くの言語で採用されています。一方で、漢字は中国語、日本語で使用され、数千の文字からなる表意文字体系を持ちます。アラビア文字は右から左へ書かれ、アラビア語、ウルドゥー語、ペルシア語などで使用されています。また、インドではデーヴァナーガリー文字(ヒンディー語)、ベンガル文字、テルグ文字、タミル文字など、多様な文字体系が発達しました。

言語の分布は歴史、政治、経済の影響を強く受けています。フランス語はアフリカで話者数が急速に増加しており、これはかつてのフランス植民地の影響です。同様に、ポルトガル語はブラジルという人口大国を持つことで、南米最大の言語となっています。インドネシア語は母語話者が比較的少ないものの、数百の民族と言語を持つ国における共通語として、第二言話者が非常に多い特徴を持っています。

今後の言語の趨勢として、英語の国際的な優位性は維持される一方で、ヒンディー語、ベンガル語、ウルドゥー語などの南アジアの言語は、人口増加に伴い話者数がさらに増加すると予想されています。また、デジタル技術の普及により、これまでマイノリティであった言語の記録や保存も進められています。世界の言語的多様性を理解することは、異文化理解とグローバルなコミュニケーションにおいて、ますます重要になっています。