- 正規分布でつりがね型のデータ分布の時に、平均値と中央値が綺麗に出やすい。
- 平均値と中央値の値のずれがあまりなければ平均値が使いやすい。
- 最頻値と中央値は外れ値の影響を受けにくい
もくじ
平均値
データの総和をサンプル数で割ったもの、算術平均。
- メリット
データが更新されると平均値も影響を受け更新される - デメリット
極端に低い値、高い値の影響を受けてしまう。
中央値
昇順で並べた時の中央の値
- メリット
異常値、極端に低い値や高い値の影響を受けない - デメリット
低い値や高い値に更新されても中央値は変わらない為、データ全体の比較や変化には向かない
関連
最頻値
一番多く頻出する値
- メリット
頻出頻度の高いデータがわかる
外れ値の影響を受けにくい - デメリット
データ数が多くちらばっていないといけない。
@see