統計
2011年07月09日
QC検定(品質管理検定)で勉強した知識を実生活に生かす。
・タダになるとはすごい
・確率が1/50は、そんなに低くない数値
など、いろんな考えが出たと思いますが
「無料」という言葉にとらわれすぎると本質を見落としてしまう恐れがあります。
では、この広告の本質とは
50人に1人が無料=100人に2人が無料となり
2%の人が無料であり、経営者側から見れば
2%割引に過ぎないのです。
よって
10%引きを利用するほうがお得なのです。
折角、統計を勉強しているのですから、このような実際の生活に結びつくような考え方を身に付けて
ほしいと思います。
- ブログネタ:
- QC検定(品質管理検定)の受検対策 に参加中!
2008年11月12日
統計解析で内閣支持率を推定する。
QC検定で統計解析の推定について
先日、全国世論調査の結果が新聞で発表されていました。
その中の調査項目の一つであった「今の内閣を支持しますか?」
は40.9%となっていました。
ここで世論調査について統計の観点から解説します。
*調査の方法はコンピューターでランダムに電話をかける方法
でRDD法と呼ばれている方法。n=1027人となっています
世論調査とは、全員と対象におこなうのではなく、全国の有権者
の中からランダムに選び、それらの人を対象に調査することです。
たとえ、全員の有権者を対象にしなくても、一部の有権者を対象
にするだけで、かなり精度の高い結果が得られると言われてい
ます。この世論調査のように、集団から一部を抜き出しておこな
う調査を標本調査と言われています。
大数の法則
「nが十分大きければ、ほとんどの場合、標本で得られた平均値
は母集団の平均値に近い値をとる」
が該当してきます。
中心極限定理
「nが十分大きければ、母集団の従う確率分布に関係なく
標本平均は正規分布に従う」
ではこの標本から
有権者全体の内閣を支持する割合を求めてみます。
その支持する比率=母比率をpとすると
その標本の支持すると答えた人の人数をXとすると、Xの従う
確率分布は二項分布B(n、p)となります。
ここでnが十分に大きいと考えて、中心極限定理より
期待値=np、分散=np(1−p)の正規分布に置き換えること
ができます。
今回で支持すると答えた人の割合X/n=標本比率p-barとした
とき母比率pを推定してみるとします。
標本が十分大きいとき、標本比率p-barは期待値=p、
分散=p(1−p)/nに従うとみなすことができます。
この標本比率p-barを標準化してZに置き換えると
Z=(p-bar−P)/(√P(1−P)/n) となり
このZは標準正規分布N(0、1)に従います。
それでは、母比率pに対する信頼区間を求めてみますと、
標準正規分布N(0,1)に従う確率変数Zが95%の確率で
満たす不等式は
−1.96<Z<+1.96より
↓ ↓ ↓ ↓ ↓ ↓
p-bar−1.96√p(1-p)/n<p<p-bar+1.96√p(1-p)/n
となります。
ここで標本nが十分に大きいので、大数の法則により標本比率
p-barはpに近い値をとると考えると
「95%の確からしさで母比率pは標本比率p-barを中心にした
幅が2*1.96√p-bar(1-p-bar)/nの区間内にある」
といえることになります。
これを計算すると
37.5%<p<44.3%
となります。
今回の世論調査は
1027人のうち420人が「支持する」と回答したことより
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
有権者全体としては95%の確からしさでは
37.5%<p<44.3%
の人が支持するとなります。
いずれにしても、50%に達しておりませんね。
*−1.96<Z<+1.96とありますが、なぜ1.96なのか
解りますか?これが解らないとQC2級の合格は?。。。。
そんな人のために
QC検定2級eラーニング
2008年11月05日
QC検定の統計の代表値
昨日の記事で書きましたが、平均値はかならずしもデータ全体の中央の位置を表すとは限らないことについて説明しました。
昨日の貯蓄額が4000万以上の方が、他のデータ比べて飛びぬけて、少しでもあるときに、このようなことは起きやすいと言われています。
このような時、平均値の代わりにデータ全体の中央の位置を表す数値としてよく使われます。
昨日の事例では中位数=1018万円となっていましたね。
メディアンは中位数または中央値とも呼ばれています。
貯蓄額高分布
メディアンはデータを大きさの順に並べたときに、ちょうど順番が真ん中になる値を言います。
データの個数が奇数か偶数かでメディアンの求め方は違ってきます。
メディアン計算例として
データが9,1、5、3,7と5個(奇数個)あったとします。
大きさの順に並び変えます。このときは小→大、または大→小のどちらでもかまいません。
上記のデータを小→大に並び替えると
1、3、5、7、9となります。このときの中央にくる値は5ですね。
よってメディアンは5となります。
今度はデータが偶数個あったときは
データが9、1,5、3,7、6とすると
データを小→大に並び替えると
1、3、5、6、7、9 となりこのときに中央にくる数字は5と6なので
メディアン=(5+6)/2=5.5となります。
これでメディアンの説明は終わります。
また、昨日来年からQC検定2級試験項目に追加となった
「信頼性工学」「新QC7つ道具」のテキストを作成いたしました。
よって全ての項目は整備しましたので、申し込みをお持ちしております。
QC検定受験する貴方
”これまで恥ずかしくて誰にも聞けなかった長年の悩みを親切丁寧に解説いたします”。
↓ ↓ ↓ ↓ ↓ ↓
QC検定2級e-ラーニング
2008年11月04日
QC検定の統計の基礎
平均値とは、データ全体のほぼ中央の位置を示すデータであります。
平均値はについては、特に詳しく説明をする必要もないと思いますが、ここで平均値がデータ全体を正しく代表する数値でない場合もありますので注意が必要です。
統計局のホームペイジより貯蓄の世帯分布(19年実績)
貯蓄現在高分布表
前回の記事で紹介した代表値は
平均=1719万円、メディアン=1018万円、
モード=200万円未満
となっています。
貯蓄額の分布は低い方に偏っていることが解ります。
実際、平均貯蓄額1719万円を下回る世帯数約3分の2であると発表されています。
平均貯蓄額が1719万円と聞かされても、実感がわいてこない人は多いと思います。私もその一人ですが。
ややもすれば、全体の中心を表す平均値で物事を考えがちですが、貯蓄額は平均値だけで判断してはいけない事例だと思います。
来年3月にQC検定2級を受験する方へ
計算問題が解らず悩んでいるのは貴方だけではありません。
そんな貴方に強力な味方になってくれるでしょう。
ここです。
新たなQC検定2級試験項目対応コースです