データってなんだ?

2016年8月1日

どうも。2015年秋の第1問、サンプリングの説明に関する穴埋めでいきなり間違えたおいちゃんです。

用語は覚えよう

この辺は統計知らなくても半分は国語の問題なので当てずっぽうでもソコソコいけるんですが、用語をキチンと押さえておかないと間違えます。

実際、サンプルとデータの違いを明確に意識していなかったので(よく考えればサンプルは標本とわかるのだけれど)以下のような問題を間違えてしまいました。

問い)母集団から抽出した標本を測定して得られるものは?
正答)データ
誤答)サンプル

過去問の解説によるとこの手のヤツはサービス問題。確実に取ることが重要だそうです。

統計的品質管理

というわけでサンプリングあたりから勉強してみましょう。テキストの126ページ、第12章「データの取り方とまとめ方」から。これは品質管理手法の範囲ね。

冒頭からずらずらと書いてありますが、多分重要なのは最後の段落にある以下の内容。

不規則に並んだデータを的確に整理すると規則性を発見でき、そのための道具が統計的手法や品質管理手法である。

マクラの部分はここだけ押さえておけばいいのかな。

データの種類

あらためて意識したコトもないですが、データには種類があるそうですよ。

値によって表わすことができるかできないかで、数値データと言語データのふたつに大別します。そのうち数値データをさらに連続量を扱う計量値と分離量である計数値に分けて考えます。

数値データ
計量値(単位を持つ連続量)
計数値(数を数えて得られる値)
言語データ(値によらず言葉で表現される情報)

具体例を出すとこんな感じかな。

  • ある部品の大きさを表す「寸法」は計量値。
  • 液晶の画素欠点の数を表す「個数」は計数値。
  • カメラのフォーカスリングを回したときの感触を表す「フィーリング」は言語データ。

画素の欠点数なんかは単位面積当たりで表現されるので一見計量値と間違えそうですが、連続量ではないので計数値です。