メディアン

2008年11月10日

QC検定での統計の初歩について

3つの代表値である平均値・モード・メディアンの関係

ヒストグラム上での上記の3つの代表値の大小関係をもう一度
説明します。
ここで、平均値=データ自体の値、モ−ド=データの頻度、
メディアン=データの順番を表しています。
これは問題ないですね。

また過去のQC検定試験でヒストグラムの分布状態にによって、
この3つの代表値の関係を問う問題が2006年2級の問10で
出題されています。
ヒストグラムが左の方に偏っているときの、平均値、モ−ド、
メディアンの大小関係を求める問題です。
左の方に偏っているということは、左の方の山が高い=度数が多く発生してるものが左側に偏ってあるというこです。

一般的に左を0(起点)としますので、モードが3つの中で一番小さい値になることが解りますね。

続いてメディアンはデータの順番に並べたときに中央にくる値ですので左側の度数が多いので、小さい順番に並べたときには、中央よりも数の多い左側にくることがくることがわかります。

平均値はデータ自体の値ですので、右すそにある値に影響を受けますのでメディアンより高い数値をとります。従ってメディアンより右側にきます。

よって
・ヒストグラムが左の方に偏っているときの大小関係は、一般的に
モード<メディアン<平均値  となります。

このような統計の初歩も含めて、統計=計算問題の解き方を
わかりやすく説明しております
QC検定2級eラーニングを準備しました。
詳細はここです。
QC検定2級eラーニング





山田ジョージ at 09:55|PermalinkComments(0)TrackBack(0)

2008年11月07日

QC検定の統計の初歩 ”モード”について

最も多く現れるモードについて

メディアンと並んで、平均値の代わりにデータ全体の中央の位置を表す数値として、モードが使われます。モードは、データの中で最も多く現れてくる値のことであり、最頻値とも呼ばれています。
例えば5人の身長が
170cm、175cm、165cm、170cm、180cmとすると
このときのモードは170cmとなります。

また、度数分布表で、最も度数が高い階級値がモードとなってきます。
貯蓄額のデータについてモードを求めてみると、200万円未満が14%と最も多く占めていることがわかります。
貯蓄額高分布

以前記事で説明しましたが、上記の貯蓄額高分布表は
・ヒストグラムが左のほうに偏っているときに当てはまるので
3つの代表値である、平均値、メディアン、モードの大小関係は
次のようになることが解ります。
→平均値>メディアン>モード





山田ジョージ at 07:07|PermalinkComments(0)TrackBack(0)

2008年11月05日

QC検定の統計の代表値

統計の代表値の一つであるメディアンについて

昨日の記事で書きましたが、平均値はかならずしもデータ全体の中央の位置を表すとは限らないことについて説明しました。
昨日の貯蓄額が4000万以上の方が、他のデータ比べて飛びぬけて、少しでもあるときに、このようなことは起きやすいと言われています。
このような時、平均値の代わりにデータ全体の中央の位置を表す数値としてよく使われます。
昨日の事例では中位数=1018万円となっていましたね。
メディアンは中位数または中央値とも呼ばれています。
貯蓄額高分布
メディアンはデータを大きさの順に並べたときに、ちょうど順番が真ん中になる値を言います。
データの個数が奇数か偶数かでメディアンの求め方は違ってきます。

メディアン計算例として
データが9,1、5、3,7と5個(奇数個)あったとします。
大きさの順に並び変えます。このときは小→大、または大→小のどちらでもかまいません。
上記のデータを小→大に並び替えると
1、3、5、7、9となります。このときの中央にくる値は5ですね。
よってメディアンは5となります。

今度はデータが偶数個あったときは
データが9、1,5、3,7、6とすると
データを小→大に並び替えると
1、3、5、6、7、9 となりこのときに中央にくる数字は5と6なので
メディアン=(5+6)/2=5.5となります。
これでメディアンの説明は終わります。

また、昨日来年からQC検定2級試験項目に追加となった
「信頼性工学」「新QC7つ道具」のテキストを作成いたしました。
よって全ての項目は整備しましたので、申し込みをお持ちしております。
QC検定受験する貴方

”これまで恥ずかしくて誰にも聞けなかった長年の悩みを親切丁寧に解説いたします”。
        ↓ ↓ ↓ ↓ ↓ ↓
      QC検定2級e-ラーニング




山田ジョージ at 08:08|PermalinkComments(0)TrackBack(0)

2008年10月30日

QC検定の計算問題の基本となる統計とは

統計を現す3つのデータ
(1)平均値=データの合計をデータの個数で割って得られる値
(2)メディアン=データを大きさの順に並べたとき、真ん中になる値
(3)モード=最も多く現れているデータの値

ある程度データの個数が多いとき、上記の代表値には、下記のような大小の関係があると言われています。
・ヒストグラムはほぼ左右対称なとき
→平均値≒メディアン≒モード
・ヒストグラムが右のほうに偏っているとき
→平均値<メディアン<モード
・ヒストグラムが左のほうに偏っているとき
→平均値>メディアン>モード

このように、ヒストグラムの形によって代表値の大小関係は異なってきますので、代表値の大小関係がわかれば、それをもとにして
ヒストグラムの状態がおおそよのことが解ります。

このように、個々のデータにはとらわれず、そのデータ全体としてどのような特徴などを調べることが統計と言われています。

また、統計において中心を現している上記の3つの代表値の次に考えなければないないことは、データが全体としてどれだけ広がっているか、つまり、データのばらつき具合の大きさをどのように現されているのが大事になってきます。

個々のデータと平均値の差(偏差)を求めると、その合計は0となるので、ばらつきを現す値としては使えないことが解ります。
偏差の合計=(データ−平均値)の合計
       =(データの合計)−(平均値の合計)
       =(データの合計)−(平均値*データの個数)
       =(データの合計)−(データの合計)
       =0
ここで平均値=データの合計/データの個数より

以上のことより、個々のデータと平均値との差(偏差)を2乗したもの合計をデータの個数で割った値、すなはち偏差2乗の平均値を分散といい、そしてその平方根の標準偏差をばらつきを現わす値として使われています。




山田ジョージ at 17:38|PermalinkComments(0)TrackBack(0)