概要

統計指標

統計指標は、データの特徴を数値化して表現するための指標群です。代表値(平均値、中央値、最頻値)によるデータの中心的傾向、散布度(分散、標準偏差、変動係数)によるデータの散らばり具合、そして分布の形状を表す指標などがあります。これらはデータ分析、品質管理、経営判断など幅広い分野で活用されています。

統計学 データ分析 代表値 散布度 基本統計量 品質管理
コード スラッグ 名称 概要 カテゴリ
01 mean 平均値 全データの合計をデータ数で割った値です。 代表値
02 median 中央値 データを大小順に並べたときの中央に位置する値です。 代表値
03 mode 最頻値 データの中で最も出現回数が多い値です。 代表値
04 variance 分散 平均からの偏差の2乗の平均です。 散布度
05 standard-deviation 標準偏差 分散の平方根で、データの散らばり具合を表します。 散布度
06 coefficient-of-variation 変動係数 標準偏差を平均値で割った値で、相対的な散らばりを表します。 散布度
07 range 範囲 最大値と最小値の差です。 散布度
08 skewness 歪度 分布の左右の非対称性を表す指標です。 形状の指標
09 kurtosis 尖度 分布の尖り具合と裾の厚さを表す指標です。 形状の指標
10 percentile パーセンタイル データを100等分した位置の値です。 位置の指標

統計指標は、大量のデータから本質的な情報を抽出し、定量的に表現するための基礎的なツールです。データの中心的傾向を示す代表値、データの散らばり具合を示す散布度、そして分布の形状を表す指標が主な分類となります。

代表値としては平均値、中央値、最頻値の3つが基本となります。平均値は全データを反映するため最も一般的に使用されますが、外れ値の影響を受けやすいという特徴があります。一方、中央値は外れ値に強く、分布が歪んでいるデータの分析に適しています。最頻値は質的データにも適用でき、最も頻繁に出現する値を示します。これら3つの代表値の関係から、データの分布の歪みを推測することも可能です。

散布度の指標は、データのばらつき具合を測定します。標準偏差と分散は最も基本的な指標で、品質管理やリスク分析で広く活用されています。変動係数は異なる単位やスケールのデータ間で比較を行う際に有効です。また、パーセンタイルはデータの相対的な位置を把握するのに適しており、成長曲線やランキング分析などに利用されます。

これらの統計指標を適切に組み合わせて使用することで、データの特徴を多角的に捉えることができます。データ分析の現場では、単一の指標に依存せず、複数の指標を総合的に評価することが重要です。