基本統計量

2018年6月6日

2015年秋の2問目、平均と分散を計算する問題。これはたまたま数年前に資産の期待収益率の計算のために統計計算の復習をしていたので正解しました。やるな、おいちゃん!

基本統計量の表中、分散の数式に誤記があったので訂正しました。

基本統計量

念のため基本統計量をおさらいしておきましょう。統計量としてはテキストには以下のものが載っています。

項目 記号 数式 定義
総和 \[\sum\] \[\sum_{i=1}^{n} x_{n}\] データの総和。
データ数 \[n\] データの総数。
平均値 \[\bar{x}\] \[\frac{\sum}{n}\]
メディアン
( 中央値 )
\[\tilde{x}\] データの中央にある値。データ数が奇数個なら中央のデータ、偶数個なら中央二つのデータの平均値
範囲 \[R\] \[x_{max} – x_{min}\] データの最大値と最小値の差。
最大値 \[x_{max}\] データの最大値
最小値 \[x_{min}\] データの最小値
平方和 \[S\] \[\sum_{i=1}^{n}(x_{n} – \bar{x})^2\] 各データの平均値からの偏差の二乗和。
(不偏)分散 \[V\] \[\frac{S}{n-1}\] 平方和をデータの総数-1で除したもの。
標準偏差 \[s\] \[\sqrt{V}\] 分散の平方根。
変動係数 \[CV\] \[\frac{s}{\bar{x}}\] 標準偏差を平均値で除したもの。

この中で、データの中心位置とばらつきの程度を示す値はそれぞれ以下となります。

中心を表す値
  • 平均値
  • 中央値
ばらつきを表す値
  • 範囲
  • 分散
  • 標準偏差

平均値の算出では生データよりも1桁下の位まで、データ数が多い場合は2桁下、少ない場合は生データと同じ桁とJISで規定されています。

Won’t you stay for me

メディアン!


…いや、メジアンと似てるかなって。。。