XML

世界の言語詳細データ - XML

世界の言語詳細データは、Ethnologue等の言語学的研究に基づき、世界で話されている主要な言語について包括的な情報を提供するものです。各言語について、語族分類、使用される文字体系(スクリプト)、母語話者数(L1)、第二言語話者数(L2)、総話者数などの統計データを含みます。現在、世界には約7,000以上の言語が存在しますが、このデータセットでは特に話者数5,000万人以上の主要言語を中心に収録しています。言語研究、国際ビジネス、教育、翻訳サービスなど様々な分野で活用できます。

言語 語族 文字体系 話者数 言語学 多言語 国際コミュニケーション
<?xml version="1.0" encoding="UTF-8"?>
<items>
  <item>
    <code>1</code>
    <slug>english</slug>
    <name>英語</name>
    <description>世界で最も広く話されている言語で、国際共通語として機能しています。</description>
    <languageFamily>インド・ヨーロッパ語族(ゲルマン語派)</languageFamily>
    <nativeSpeakers>380000000</nativeSpeakers>
    <secondLanguageSpeakers>1140000000</secondLanguageSpeakers>
    <totalSpeakers>1520000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>2</code>
    <slug>mandarin-chinese</slug>
    <name>標準中国語(北京語)</name>
    <description>母語話者数世界最大の言語で、中国大陸・台湾・シンガポールで主に使用されています。</description>
    <languageFamily>シノ・チベット語族(中国語派)</languageFamily>
    <nativeSpeakers>940000000</nativeSpeakers>
    <secondLanguageSpeakers>240000000</secondLanguageSpeakers>
    <totalSpeakers>1180000000</totalSpeakers>
    <writingSystem>漢字(簡体字・繁体字)</writingSystem>
  </item>
  <item>
    <code>3</code>
    <slug>hindi</slug>
    <name>ヒンディー語</name>
    <description>インドの主要言語で、インド・アーリア語派に属する言語です。</description>
    <languageFamily>インド・ヨーロッパ語族(インド・アーリア語派)</languageFamily>
    <nativeSpeakers>350000000</nativeSpeakers>
    <secondLanguageSpeakers>260000000</secondLanguageSpeakers>
    <totalSpeakers>610000000</totalSpeakers>
    <writingSystem>デーヴァナーガリー文字</writingSystem>
  </item>
  <item>
    <code>4</code>
    <slug>spanish</slug>
    <name>スペイン語</name>
    <description>ロマンス語派の言語で、スペイン・中南米で広く使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(ロマンス語派)</languageFamily>
    <nativeSpeakers>490000000</nativeSpeakers>
    <secondLanguageSpeakers>70000000</secondLanguageSpeakers>
    <totalSpeakers>560000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>5</code>
    <slug>french</slug>
    <name>フランス語</name>
    <description>ロマンス語派の言語で、アフリカを中心に話者数が増加しています。</description>
    <languageFamily>インド・ヨーロッパ語族(ロマンス語派)</languageFamily>
    <nativeSpeakers>80000000</nativeSpeakers>
    <secondLanguageSpeakers>240000000</secondLanguageSpeakers>
    <totalSpeakers>320000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>6</code>
    <slug>arabic</slug>
    <name>アラビア語</name>
    <description>アフロ・アジア語族の言語で、中東・北アフリカで広く使用されています。</description>
    <languageFamily>アフロ・アジア語族(セム語派)</languageFamily>
    <nativeSpeakers>320000000</nativeSpeakers>
    <secondLanguageSpeakers>20000000</secondLanguageSpeakers>
    <totalSpeakers>340000000</totalSpeakers>
    <writingSystem>アラビア文字</writingSystem>
  </item>
  <item>
    <code>7</code>
    <slug>bengali</slug>
    <name>ベンガル語</name>
    <description>インド・アーリア語派の言語で、バングラデシュとインド東部で使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(インド・アーリア語派)</languageFamily>
    <nativeSpeakers>230000000</nativeSpeakers>
    <secondLanguageSpeakers>50000000</secondLanguageSpeakers>
    <totalSpeakers>280000000</totalSpeakers>
    <writingSystem>ベンガル文字</writingSystem>
  </item>
  <item>
    <code>8</code>
    <slug>portuguese</slug>
    <name>ポルトガル語</name>
    <description>ロマンス語派の言語で、ブラジルを含むポルトガル語圏で使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(ロマンス語派)</languageFamily>
    <nativeSpeakers>230000000</nativeSpeakers>
    <secondLanguageSpeakers>40000000</secondLanguageSpeakers>
    <totalSpeakers>270000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>9</code>
    <slug>russian</slug>
    <name>ロシア語</name>
    <description>スラブ語派の言語で、旧ソ連諸国で広く使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(スラブ語派)</languageFamily>
    <nativeSpeakers>150000000</nativeSpeakers>
    <secondLanguageSpeakers>110000000</secondLanguageSpeakers>
    <totalSpeakers>260000000</totalSpeakers>
    <writingSystem>キリル文字</writingSystem>
  </item>
  <item>
    <code>10</code>
    <slug>urdu</slug>
    <name>ウルドゥー語</name>
    <description>インド・アーリア語派の言語で、パキスタンの国語です。</description>
    <languageFamily>インド・ヨーロッパ語族(インド・アーリア語派)</languageFamily>
    <nativeSpeakers>70000000</nativeSpeakers>
    <secondLanguageSpeakers>180000000</secondLanguageSpeakers>
    <totalSpeakers>250000000</totalSpeakers>
    <writingSystem>ペルシア・アラビア文字</writingSystem>
  </item>
  <item>
    <code>11</code>
    <slug>indonesian</slug>
    <name>インドネシア語</name>
    <description>オーストロネシア語族の言語で、インドネシアの公用語です。</description>
    <languageFamily>オーストロネシア語族</languageFamily>
    <nativeSpeakers>40000000</nativeSpeakers>
    <secondLanguageSpeakers>210000000</secondLanguageSpeakers>
    <totalSpeakers>250000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>12</code>
    <slug>german</slug>
    <name>ドイツ語</name>
    <description>ゲルマン語派の言語で、中央ヨーロッパで広く使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(ゲルマン語派)</languageFamily>
    <nativeSpeakers>80000000</nativeSpeakers>
    <secondLanguageSpeakers>55000000</secondLanguageSpeakers>
    <totalSpeakers>135000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>13</code>
    <slug>japanese</slug>
    <name>日本語</name>
    <description>日本で使用される言語で、系統的には孤立した言語とされています。</description>
    <languageFamily>日本語族(ジャポニック語族)</languageFamily>
    <nativeSpeakers>124000000</nativeSpeakers>
    <secondLanguageSpeakers>1000000</secondLanguageSpeakers>
    <totalSpeakers>125000000</totalSpeakers>
    <writingSystem>漢字・ひらがな・カタカナ</writingSystem>
  </item>
  <item>
    <code>14</code>
    <slug>nigerian-pidgin</slug>
    <name>ナイジェリア・ピジン語</name>
    <description>英語を基盤とするクレオール語で、ナイジェリアで広く使用されています。</description>
    <languageFamily>英語系クレオール語</languageFamily>
    <nativeSpeakers>5000000</nativeSpeakers>
    <secondLanguageSpeakers>115000000</secondLanguageSpeakers>
    <totalSpeakers>120000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>15</code>
    <slug>egyptian-arabic</slug>
    <name>エジプト・アラビア語</name>
    <description>アラビア語の方言の一つで、エジプトで広く使用されています。</description>
    <languageFamily>アフロ・アジア語族(セム語派)</languageFamily>
    <nativeSpeakers>100000000</nativeSpeakers>
    <secondLanguageSpeakers>20000000</secondLanguageSpeakers>
    <totalSpeakers>120000000</totalSpeakers>
    <writingSystem>アラビア文字</writingSystem>
  </item>
  <item>
    <code>16</code>
    <slug>marathi</slug>
    <name>マラーティー語</name>
    <description>インドのアーリア語派の言語で、マハーラーシュトラ州で主に使用されています。</description>
    <languageFamily>インド・ヨーロッパ語族(インド・アーリア語派)</languageFamily>
    <nativeSpeakers>83000000</nativeSpeakers>
    <secondLanguageSpeakers>16000000</secondLanguageSpeakers>
    <totalSpeakers>99000000</totalSpeakers>
    <writingSystem>デーヴァナーガリー文字</writingSystem>
  </item>
  <item>
    <code>17</code>
    <slug>telugu</slug>
    <name>テルグ語</name>
    <description>ドラヴィダ語族の言語で、インド南部で広く使用されています。</description>
    <languageFamily>ドラヴィダ語族</languageFamily>
    <nativeSpeakers>83000000</nativeSpeakers>
    <secondLanguageSpeakers>13000000</secondLanguageSpeakers>
    <totalSpeakers>96000000</totalSpeakers>
    <writingSystem>テルグ文字</writingSystem>
  </item>
  <item>
    <code>18</code>
    <slug>turkish</slug>
    <name>トルコ語</name>
    <description>テュルク語族の言語で、トルコとキプロスで主に使用されています。</description>
    <languageFamily>テュルク語族</languageFamily>
    <nativeSpeakers>84000000</nativeSpeakers>
    <secondLanguageSpeakers>7000000</secondLanguageSpeakers>
    <totalSpeakers>91000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>19</code>
    <slug>tamil</slug>
    <name>タミル語</name>
    <description>ドラヴィダ語族の古典的言語で、インド南部とスリランカで使用されています。</description>
    <languageFamily>ドラヴィダ語族</languageFamily>
    <nativeSpeakers>75000000</nativeSpeakers>
    <secondLanguageSpeakers>11000000</secondLanguageSpeakers>
    <totalSpeakers>86000000</totalSpeakers>
    <writingSystem>タミル文字</writingSystem>
  </item>
  <item>
    <code>20</code>
    <slug>cantonese</slug>
    <name>広東語(カントン語)</name>
    <description>中国語群の方言で、香港・マカオ・広東省で主に使用されています。</description>
    <languageFamily>シノ・チベット語族(中国語派)</languageFamily>
    <nativeSpeakers>85000000</nativeSpeakers>
    <secondLanguageSpeakers>1000000</secondLanguageSpeakers>
    <totalSpeakers>86000000</totalSpeakers>
    <writingSystem>漢字</writingSystem>
  </item>
  <item>
    <code>21</code>
    <slug>vietnamese</slug>
    <name>ベトナム語</name>
    <description>オーストロアジア語族の言語で、ラテン文字を使用する東アジアの言語です。</description>
    <languageFamily>オーストロアジア語族(ベト・ムオン語派)</languageFamily>
    <nativeSpeakers>85000000</nativeSpeakers>
    <secondLanguageSpeakers>12000000</secondLanguageSpeakers>
    <totalSpeakers>97000000</totalSpeakers>
    <writingSystem>ラテン文字(クオック・グー)</writingSystem>
  </item>
  <item>
    <code>22</code>
    <slug>wu-chinese</slug>
    <name>呉語(上海語)</name>
    <description>中国語群の方言で、上海を中心とした長江デルタ地域で使用されています。</description>
    <languageFamily>シノ・チベット語族(中国語派)</languageFamily>
    <nativeSpeakers>83000000</nativeSpeakers>
    <secondLanguageSpeakers>0</secondLanguageSpeakers>
    <totalSpeakers>83000000</totalSpeakers>
    <writingSystem>漢字</writingSystem>
  </item>
  <item>
    <code>23</code>
    <slug>tagalog</slug>
    <name>タガログ語(フィリピノ語)</name>
    <description>オーストロネシア語族の言語で、フィリピンの公用語です。</description>
    <languageFamily>オーストロネシア語族</languageFamily>
    <nativeSpeakers>30000000</nativeSpeakers>
    <secondLanguageSpeakers>53000000</secondLanguageSpeakers>
    <totalSpeakers>83000000</totalSpeakers>
    <writingSystem>ラテン文字</writingSystem>
  </item>
  <item>
    <code>24</code>
    <slug>korean</slug>
    <name>韓国語・朝鮮語</name>
    <description>朝鮮半島で使用される言語で、ハングルという独自の文字体系を持ちます。</description>
    <languageFamily>朝鮮語族(孤立した言語)</languageFamily>
    <nativeSpeakers>80000000</nativeSpeakers>
    <secondLanguageSpeakers>2000000</secondLanguageSpeakers>
    <totalSpeakers>82000000</totalSpeakers>
    <writingSystem>ハングル</writingSystem>
  </item>
  <item>
    <code>25</code>
    <slug>farsi</slug>
    <name>ペルシア語(ファルシ)</name>
    <description>イランで使用されるインド・ヨーロッパ語族の言語です。</description>
    <languageFamily>インド・ヨーロッパ語族(イラン語派)</languageFamily>
    <nativeSpeakers>55000000</nativeSpeakers>
    <secondLanguageSpeakers>24000000</secondLanguageSpeakers>
    <totalSpeakers>79000000</totalSpeakers>
    <writingSystem>ペルシア・アラビア文字</writingSystem>
  </item>
</items>