TSV

世界の言語詳細データ - TSV

世界の言語詳細データは、Ethnologue等の言語学的研究に基づき、世界で話されている主要な言語について包括的な情報を提供するものです。各言語について、語族分類、使用される文字体系(スクリプト)、母語話者数(L1)、第二言語話者数(L2)、総話者数などの統計データを含みます。現在、世界には約7,000以上の言語が存在しますが、このデータセットでは特に話者数5,000万人以上の主要言語を中心に収録しています。言語研究、国際ビジネス、教育、翻訳サービスなど様々な分野で活用できます。

言語 語族 文字体系 話者数 言語学 多言語 国際コミュニケーション
code	slug	name	description	languageFamily	nativeSpeakers	secondLanguageSpeakers	totalSpeakers	writingSystem
1	english	英語	世界で最も広く話されている言語で、国際共通語として機能しています。	インド・ヨーロッパ語族(ゲルマン語派)	380000000	1140000000	1520000000	ラテン文字
2	mandarin-chinese	標準中国語(北京語)	母語話者数世界最大の言語で、中国大陸・台湾・シンガポールで主に使用されています。	シノ・チベット語族(中国語派)	940000000	240000000	1180000000	漢字(簡体字・繁体字)
3	hindi	ヒンディー語	インドの主要言語で、インド・アーリア語派に属する言語です。	インド・ヨーロッパ語族(インド・アーリア語派)	350000000	260000000	610000000	デーヴァナーガリー文字
4	spanish	スペイン語	ロマンス語派の言語で、スペイン・中南米で広く使用されています。	インド・ヨーロッパ語族(ロマンス語派)	490000000	70000000	560000000	ラテン文字
5	french	フランス語	ロマンス語派の言語で、アフリカを中心に話者数が増加しています。	インド・ヨーロッパ語族(ロマンス語派)	80000000	240000000	320000000	ラテン文字
6	arabic	アラビア語	アフロ・アジア語族の言語で、中東・北アフリカで広く使用されています。	アフロ・アジア語族(セム語派)	320000000	20000000	340000000	アラビア文字
7	bengali	ベンガル語	インド・アーリア語派の言語で、バングラデシュとインド東部で使用されています。	インド・ヨーロッパ語族(インド・アーリア語派)	230000000	50000000	280000000	ベンガル文字
8	portuguese	ポルトガル語	ロマンス語派の言語で、ブラジルを含むポルトガル語圏で使用されています。	インド・ヨーロッパ語族(ロマンス語派)	230000000	40000000	270000000	ラテン文字
9	russian	ロシア語	スラブ語派の言語で、旧ソ連諸国で広く使用されています。	インド・ヨーロッパ語族(スラブ語派)	150000000	110000000	260000000	キリル文字
10	urdu	ウルドゥー語	インド・アーリア語派の言語で、パキスタンの国語です。	インド・ヨーロッパ語族(インド・アーリア語派)	70000000	180000000	250000000	ペルシア・アラビア文字
11	indonesian	インドネシア語	オーストロネシア語族の言語で、インドネシアの公用語です。	オーストロネシア語族	40000000	210000000	250000000	ラテン文字
12	german	ドイツ語	ゲルマン語派の言語で、中央ヨーロッパで広く使用されています。	インド・ヨーロッパ語族(ゲルマン語派)	80000000	55000000	135000000	ラテン文字
13	japanese	日本語	日本で使用される言語で、系統的には孤立した言語とされています。	日本語族(ジャポニック語族)	124000000	1000000	125000000	漢字・ひらがな・カタカナ
14	nigerian-pidgin	ナイジェリア・ピジン語	英語を基盤とするクレオール語で、ナイジェリアで広く使用されています。	英語系クレオール語	5000000	115000000	120000000	ラテン文字
15	egyptian-arabic	エジプト・アラビア語	アラビア語の方言の一つで、エジプトで広く使用されています。	アフロ・アジア語族(セム語派)	100000000	20000000	120000000	アラビア文字
16	marathi	マラーティー語	インドのアーリア語派の言語で、マハーラーシュトラ州で主に使用されています。	インド・ヨーロッパ語族(インド・アーリア語派)	83000000	16000000	99000000	デーヴァナーガリー文字
17	telugu	テルグ語	ドラヴィダ語族の言語で、インド南部で広く使用されています。	ドラヴィダ語族	83000000	13000000	96000000	テルグ文字
18	turkish	トルコ語	テュルク語族の言語で、トルコとキプロスで主に使用されています。	テュルク語族	84000000	7000000	91000000	ラテン文字
19	tamil	タミル語	ドラヴィダ語族の古典的言語で、インド南部とスリランカで使用されています。	ドラヴィダ語族	75000000	11000000	86000000	タミル文字
20	cantonese	広東語(カントン語)	中国語群の方言で、香港・マカオ・広東省で主に使用されています。	シノ・チベット語族(中国語派)	85000000	1000000	86000000	漢字
21	vietnamese	ベトナム語	オーストロアジア語族の言語で、ラテン文字を使用する東アジアの言語です。	オーストロアジア語族(ベト・ムオン語派)	85000000	12000000	97000000	ラテン文字(クオック・グー)
22	wu-chinese	呉語(上海語)	中国語群の方言で、上海を中心とした長江デルタ地域で使用されています。	シノ・チベット語族(中国語派)	83000000	0	83000000	漢字
23	tagalog	タガログ語(フィリピノ語)	オーストロネシア語族の言語で、フィリピンの公用語です。	オーストロネシア語族	30000000	53000000	83000000	ラテン文字
24	korean	韓国語・朝鮮語	朝鮮半島で使用される言語で、ハングルという独自の文字体系を持ちます。	朝鮮語族(孤立した言語)	80000000	2000000	82000000	ハングル
25	farsi	ペルシア語(ファルシ)	イランで使用されるインド・ヨーロッパ語族の言語です。	インド・ヨーロッパ語族(イラン語派)	55000000	24000000	79000000	ペルシア・アラビア文字