母集団
2008年11月19日
QC検定の基礎 母集団と標本
標本調査の代表的なものに、新聞社やテレビ局などの報道機関が行う世論調査があります。その中でも、内閣支持率は頻繁(ひんぱん)に節目に発表されています。
この調査は有権者全員を対象にするのではなく、有権者の中から数千人程度を選び出して行うことが多いと思います。
しかし、たとえ全員を対象にしていなくても、一部の有権者を対象にするだけでかなりの精度の高い結果が得られてきます。
この内閣支持率のように、集団から一部を抜き取って行う調査を標本調査と言います。
この標本から得られたデータだけでなく、その母集団を推定、検定することが重要となってきます。
先日もコメントしましたが、麻生内閣支持率を標本データで調査したものを、有権者全体では何%なるのかを推定しますと
1027人のうち420人が「支持する」と回答したことより
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
有権者全体としては95%の確からしさでは
37.5%<p<44.3%
の人が支持するとなります。
ここでの約束事として、中心極限定理が成り立つことを前提としております。
中心極限の定理とは
「母平均m、母分散σ2乗の母集団から大きさnの標本を無作為に抜き取ったとき、母集団が正規分布に従っていなくても、標本が十分大きければ、標本平均は期待値m、分散σの2乗/nの正規分布N(m、σ2乗/n)に従うとみなすことができる」
でありましたね。
このように、標本調査の結果をもとにして母数の平均値や分布状況を推測しようとするものが推測統計と呼ばれています。
この調査は有権者全員を対象にするのではなく、有権者の中から数千人程度を選び出して行うことが多いと思います。
しかし、たとえ全員を対象にしていなくても、一部の有権者を対象にするだけでかなりの精度の高い結果が得られてきます。
この内閣支持率のように、集団から一部を抜き取って行う調査を標本調査と言います。
この標本から得られたデータだけでなく、その母集団を推定、検定することが重要となってきます。
先日もコメントしましたが、麻生内閣支持率を標本データで調査したものを、有権者全体では何%なるのかを推定しますと
1027人のうち420人が「支持する」と回答したことより
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
有権者全体としては95%の確からしさでは
37.5%<p<44.3%
の人が支持するとなります。
ここでの約束事として、中心極限定理が成り立つことを前提としております。
中心極限の定理とは
「母平均m、母分散σ2乗の母集団から大きさnの標本を無作為に抜き取ったとき、母集団が正規分布に従っていなくても、標本が十分大きければ、標本平均は期待値m、分散σの2乗/nの正規分布N(m、σ2乗/n)に従うとみなすことができる」
でありましたね。
このように、標本調査の結果をもとにして母数の平均値や分布状況を推測しようとするものが推測統計と呼ばれています。