モード
2008年11月10日
QC検定での統計の初歩について
3つの代表値である平均値・モード・メディアンの関係
ヒストグラム上での上記の3つの代表値の大小関係をもう一度
説明します。
ここで、平均値=データ自体の値、モ−ド=データの頻度、
メディアン=データの順番を表しています。
これは問題ないですね。
また過去のQC検定試験でヒストグラムの分布状態にによって、
この3つの代表値の関係を問う問題が2006年2級の問10で
出題されています。
ヒストグラムが左の方に偏っているときの、平均値、モ−ド、
メディアンの大小関係を求める問題です。
左の方に偏っているということは、左の方の山が高い=度数が多く発生してるものが左側に偏ってあるというこです。
一般的に左を0(起点)としますので、モードが3つの中で一番小さい値になることが解りますね。
続いてメディアンはデータの順番に並べたときに中央にくる値ですので左側の度数が多いので、小さい順番に並べたときには、中央よりも数の多い左側にくることがくることがわかります。
平均値はデータ自体の値ですので、右すそにある値に影響を受けますのでメディアンより高い数値をとります。従ってメディアンより右側にきます。
よって
・ヒストグラムが左の方に偏っているときの大小関係は、一般的に
モード<メディアン<平均値 となります。
このような統計の初歩も含めて、統計=計算問題の解き方を
わかりやすく説明しております
QC検定2級eラーニングを準備しました。
詳細はここです。
QC検定2級eラーニング
2008年11月07日
QC検定の統計の初歩 ”モード”について
最も多く現れるモードについて
メディアンと並んで、平均値の代わりにデータ全体の中央の位置を表す数値として、モードが使われます。モードは、データの中で最も多く現れてくる値のことであり、最頻値とも呼ばれています。
例えば5人の身長が
170cm、175cm、165cm、170cm、180cmとすると
このときのモードは170cmとなります。
また、度数分布表で、最も度数が高い階級値がモードとなってきます。
貯蓄額のデータについてモードを求めてみると、200万円未満が14%と最も多く占めていることがわかります。
貯蓄額高分布
以前記事で説明しましたが、上記の貯蓄額高分布表は
・ヒストグラムが左のほうに偏っているときに当てはまるので
3つの代表値である、平均値、メディアン、モードの大小関係は
次のようになることが解ります。
→平均値>メディアン>モード
2008年10月30日
QC検定の計算問題の基本となる統計とは
(1)平均値=データの合計をデータの個数で割って得られる値
(2)メディアン=データを大きさの順に並べたとき、真ん中になる値
(3)モード=最も多く現れているデータの値
ある程度データの個数が多いとき、上記の代表値には、下記のような大小の関係があると言われています。
・ヒストグラムはほぼ左右対称なとき
→平均値≒メディアン≒モード
・ヒストグラムが右のほうに偏っているとき
→平均値<メディアン<モード
・ヒストグラムが左のほうに偏っているとき
→平均値>メディアン>モード
このように、ヒストグラムの形によって代表値の大小関係は異なってきますので、代表値の大小関係がわかれば、それをもとにして
ヒストグラムの状態がおおそよのことが解ります。
このように、個々のデータにはとらわれず、そのデータ全体としてどのような特徴などを調べることが統計と言われています。
また、統計において中心を現している上記の3つの代表値の次に考えなければないないことは、データが全体としてどれだけ広がっているか、つまり、データのばらつき具合の大きさをどのように現されているのが大事になってきます。
個々のデータと平均値の差(偏差)を求めると、その合計は0となるので、ばらつきを現す値としては使えないことが解ります。
偏差の合計=(データ−平均値)の合計
=(データの合計)−(平均値の合計)
=(データの合計)−(平均値*データの個数)
=(データの合計)−(データの合計)
=0
ここで平均値=データの合計/データの個数より
以上のことより、個々のデータと平均値との差(偏差)を2乗したもの合計をデータの個数で割った値、すなはち偏差2乗の平均値を分散といい、そしてその平方根の標準偏差をばらつきを現わす値として使われています。