統計指標は、大量のデータから本質的な情報を抽出し、定量的に表現するための基礎的なツールです。データの中心的傾向を示す代表値、データの散らばり具合を示す散布度、そして分布の形状を表す指標が主な分類となります。
代表値としては平均値、中央値、最頻値の3つが基本となります。平均値は全データを反映するため最も一般的に使用されますが、外れ値の影響を受けやすいという特徴があります。一方、中央値は外れ値に強く、分布が歪んでいるデータの分析に適しています。最頻値は質的データにも適用でき、最も頻繁に出現する値を示します。これら3つの代表値の関係から、データの分布の歪みを推測することも可能です。
散布度の指標は、データのばらつき具合を測定します。標準偏差と分散は最も基本的な指標で、品質管理やリスク分析で広く活用されています。変動係数は異なる単位やスケールのデータ間で比較を行う際に有効です。また、パーセンタイルはデータの相対的な位置を把握するのに適しており、成長曲線やランキング分析などに利用されます。
これらの統計指標を適切に組み合わせて使用することで、データの特徴を多角的に捉えることができます。データ分析の現場では、単一の指標に依存せず、複数の指標を総合的に評価することが重要です。