QC検定（品質管理検定）受検対策:中心極限定理

中心極限定理

2008年11月19日

ＱＣ検定の基礎　母集団と標本

標本調査の代表的なものに、新聞社やテレビ局などの報道機関が行う世論調査があります。その中でも、内閣支持率は頻繁（ひんぱん）に節目に発表されています。
この調査は有権者全員を対象にするのではなく、有権者の中から数千人程度を選び出して行うことが多いと思います。
しかし、たとえ全員を対象にしていなくても、一部の有権者を対象にするだけでかなりの精度の高い結果が得られてきます。
この内閣支持率のように、集団から一部を抜き取って行う調査を標本調査と言います。

この標本から得られたデータだけでなく、その母集団を推定、検定することが重要となってきます。
先日もコメントしましたが、麻生内閣支持率を標本データで調査したものを、有権者全体では何％なるのかを推定しますと
１０２７人のうち４２０人が「支持する」と回答したことより
　　　　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓
有権者全体としては９５％の確からしさでは
　　　　　３７．５％＜ｐ＜４４．３％
の人が支持するとなります。

ここでの約束事として、中心極限定理が成り立つことを前提としております。
中心極限の定理とは
「母平均ｍ、母分散σ２乗の母集団から大きさｎの標本を無作為に抜き取ったとき、母集団が正規分布に従っていなくても、標本が十分大きければ、標本平均は期待値ｍ、分散σの２乗／ｎの正規分布Ｎ（ｍ、σ２乗／ｎ）に従うとみなすことができる」
でありましたね。

このように、標本調査の結果をもとにして母数の平均値や分布状況を推測しようとするものが推測統計と呼ばれています。

ブログネタ：: ＱＣ検定に参加中！

タグ：: QC検定; 中心極限定理; 母集団; 推定; 標本

山田ジョージ at 10:51｜Permalink│Comments(0)│TrackBack(0)│

2008年11月12日

統計解析で内閣支持率を推定する。

ＱＣ検定で統計解析の推定について

先日、全国世論調査の結果が新聞で発表されていました。
その中の調査項目の一つであった「今の内閣を支持しますか？」
は４０．９％となっていました。
ここで世論調査について統計の観点から解説します。
＊調査の方法はコンピューターでランダムに電話をかける方法
でRDD法と呼ばれている方法。ｎ＝１０２７人となっています

世論調査とは、全員と対象におこなうのではなく、全国の有権者
の中からランダムに選び、それらの人を対象に調査することです。
たとえ、全員の有権者を対象にしなくても、一部の有権者を対象
にするだけで、かなり精度の高い結果が得られると言われてい
ます。この世論調査のように、集団から一部を抜き出しておこな
う調査を標本調査と言われています。
大数の法則
「ｎが十分大きければ、ほとんどの場合、標本で得られた平均値
は母集団の平均値に近い値をとる」
が該当してきます。

中心極限定理
「ｎが十分大きければ、母集団の従う確率分布に関係なく
標本平均は正規分布に従う」

ではこの標本から
有権者全体の内閣を支持する割合を求めてみます。
その支持する比率＝母比率をｐとすると
その標本の支持すると答えた人の人数をＸとすると、Ｘの従う
確率分布は二項分布Ｂ（ｎ、ｐ）となります。
ここでｎが十分に大きいと考えて、中心極限定理より
期待値＝ｎｐ、分散＝ｎｐ（１－ｐ）の正規分布に置き換えること
ができます。

今回で支持すると答えた人の割合Ｘ/ｎ＝標本比率p-barとした
とき母比率ｐを推定してみるとします。
標本が十分大きいとき、標本比率ｐ-barは期待値＝ｐ、
分散＝ｐ（１－ｐ）／ｎに従うとみなすことができます。
この標本比率ｐ-barを標準化してＺに置き換えると
Ｚ＝（ｐ-bar－Ｐ）／（√Ｐ（１－Ｐ）/ｎ）　となり
このＺは標準正規分布Ｎ（０、１）に従います。

それでは、母比率ｐに対する信頼区間を求めてみますと、
標準正規分布Ｎ（０，１）に従う確率変数Ｚが９５％の確率で
満たす不等式は
　　　　－１．９６＜Ｚ＜＋１．９６より
　　　　　　　↓　↓　↓　↓　↓　↓
ｐ-bar－1.96√p(1-p)/n＜p＜ｐ-bar+1.96√p(1-p)/n
となります。
ここで標本ｎが十分に大きいので、大数の法則により標本比率
ｐ-barはｐに近い値をとると考えると
「９５％の確からしさで母比率ｐは標本比率ｐ-barを中心にした
幅が2＊1.96√ｐ-bar(1-ｐ-bar)/nの区間内にある」
といえることになります。
これを計算すると
　　　　　３７．５％＜ｐ＜４４．３％
となります。
今回の世論調査は
１０２７人のうち４２０人が「支持する」と回答したことより
　　　　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓　↓
有権者全体としては９５％の確からしさでは
　　　　　３７．５％＜ｐ＜４４．３％
の人が支持するとなります。
いずれにしても、５０％に達しておりませんね。

＊－１．９６＜Ｚ＜＋１．９６とありますが、なぜ１．９６なのか
解りますか？これが解らないとＱＣ２級の合格は？。。。。
そんな人のために
ＱＣ検定２級eラーニング

ブログネタ：: ＱＣ検定に参加中！

タグ：: 推定; 統計; 中心極限定理; QC検定2級; 標本

山田ジョージ at 10:53｜Permalink│Comments(0)│TrackBack(0)│

2008年10月23日

ＱＣ検定の基礎となる正規分布について

中心極限の定理とは
母集団が正規分布、一様分布、二項分布などどのような分布を
していても、標本が十分大きければ、次のようなことが成り立つと言われています。
「母平均ｍ、母分散σの母集団から大きさｎの標本をランダムに
抽出したとき、このｎが十分大きければ、母集団の従う確率分布に
関係なく、標本平均は期待値ｍ、分散σ/ｎの
正規分布Ｎ（ｍ、σ/ｎ）に従うとみなすことができる」
と言う事です。

正規分布とに従うとわかれば標準化ですね。
正規分布曲線は期待値μと分散σによって位置や形が変わるので、確率（＝面積）を直接求めることは難しいので、
そこでμやσによらない方法で確率を求めるために次のように
ＸをＺに置き換えてみると
Ｘ→Ｚ＝（Ｘ－μ）／√σ

このとき置き換えたＺも確率変数となってきます。
確率変数Ｚは期待値＝０、分散＝１の正規分布に従うと言われています。
このような正規分布Ｎ（０、１）を標準正規分布と言われています。

また、μやσがどんな値であっても、上記の式に置き換えれば、
どんな正規分布でもからなず標準正規分布に置き換えられます。
このことを標準化＝規準化といいます。

さらにＮ（０、１）は正規分布表としてまとめられてあるので、
容易に、確率を求めることができます。（正規分布表は省略）

ＱＣ検定２級以上を受験する人は、この標準化の置換することを
知っていることが大事です。

これまで、ＱＣサークルを主体に経験を重ねてこられた方で
標準化と聞いてＱＣストリーの中での歯止め＝標準化を思い出すようではもう少し統計の勉強をする必要がありますね。

そんな人のために無料レポートを作成しました。
計算問題、統計が苦手な人など参考になればと思います。
ＱＣ検定２級計算問題解説