散布図

2016年8月1日

2015年秋の第8問は散布図。例によっておいちゃんの得意技「まずは勉強」だ。

はじめに

問題点や不具合が発生したら、特性要因図で原因を推測し、データによる裏付けを取ります。

ヒストグラム
一つの特性などのデータ分布の姿を捉える
散布図
対になったデータの相互の関係を見ることができる(対応のあるデータでなければダメ)

散布図とは

対になった二組のデータを、それぞれの軸の交点にプロットした図のことです。以下のようなことができます。

  • 要因の特定
  • 特性値を得る要因の水準の把握
  • 代用特性の把握

散布図の作り方

  1. 対になったデータを集める(30組以上)
  2. データx,yそれぞれについて、最大値と最小値を求める
  3. x,yそれぞれの最大値と最小値が同じ長さになるように縦軸と横軸を設定する
  4. データを打点する
  5. 必要事項を記入する(お約束)

散布図の見方

散布図は対応する二つのデータの関係を視覚的に捉えることができ、次のようなパターンに分けることができます。

  1. 正または負の相関がある
  2. 正または負の相関がありそうだ
    x,y以外の相関がある要因について管理する必要がある
  3. 相関がない(無相関)
    他の要因を見つける必要がある
  4. その他の関係
    層別やデータ変換などしてみる

散布図を見るときは以下のような点に注意する必要がある。

異常点はないか?
飛び離れた点の原因の再発防止ができるのであれば異常点を除いて関係を判断できるが、そうでなければばらつきのひとつと考えてこれを含めて判断する
層別する
相関が小さい場合、分ければわかると考えて層別してみる
偽相関を考える
散布図では相関が見られるが技術的にそうは考えられない場合、真の相関をもつ要因が介在している場合がある

散布図は相関の有無は示すが、その理由は示さない

のだそうだ。

やってみた

さて、今回の問題はデータをもとに散布図を書いて考える問題。とりあえず4分かかったけど4項目とも正解。

解説にも散布図を作るときは層別を意識せよとあるとおり、何も考えずにプロットしていたら二組のデータが混ざっていたことが判明。一度書いた図を見直して層別かけてたら時間かかっちゃった。こんなパターン、よくあるのかな?