2017年12月28日

統計の基本「平均値」は代表値?

平均値はデータ全体のほぼ中央の位置を示す数値であり、人間の体にたとえると「へそ」にあたります。
しかし、平均値のデータが全体を正しく代表する数値かというと、必ずしもそうではない場合があります。その例を紹介します。

「家計の金融行動に関する世論調査」2017年によると、2人以上で暮らす家庭の金融資産の平均値は、1151万円と発表されています。この数値をみて、「うちはそんなに貯めていないよ」と驚かれた方がけっこういるはずです。

2017年平均値







実際、今回の調査に協力した世帯の7割弱は、この平均値よりも少ない貯蓄額しかないと報告されています。どういう「からくり」が隠れているのでしょうか。ここで、平均値の特徴について説明します。

例えば、11人の人がいるとします。そのうち10人が200万円、1人が3000万円を持っているとして、平均値はいくらでしょうか。計算してみると、
(10人×200万円)+(1人×3000万円)=5000万円
5000万円÷11人≒455万円 よって、平均値は455万円になります。
この例のように、 極端に大きい数字が混じると、平均値は高いほうに引っ張られてしまいます。実際には、11人のうち10人が平均値以下です。11人のうち10人が200万円なのですから「200万円が普通」というのが一般的な感覚ではないでしょうか。

平均値とは、ごくシンプルに「均してみたらこうなった」というだけの数字で、あたかもそのデータを代表する数値のように感じますが、必ずしもそうではないのです。

このような平均値欠点を補うために、中央値があります。
中央値とは、調査対象世帯を保有額の少ない順(あるいは多い順)に並べたとき、中位(真ん中)に位置する世帯の金融資産保有額のことをいいます。

例えば自分の金融資産保有額が中央値(下の例では380万円)である世帯からみると、保有世帯のちょうど半分の世帯が自分の金融資産保有額よりも多くの金融資産を保有、ちょうど半分の世帯が自分の金融資産保有額よりも少ない金融資産を保有していることになります。
従って、中央値は世帯全体の実感により近い数字になります。
今回調査では、金融資産保有額の中央値は380万円です。


2017年中央値






山田ジョージ at 06:07│