消費者研究法(第15回)
最終更新日:
counter:
(1998/11/27からの累積)
復習問題:信頼性、妥当性の意味を説明しなさい。
第7章 集計と検定
1 集計
1.4 単純集計
(2)定量的データの単純集計
エクセルでの集計
階級値 149以下、154以下、159以下、164以下、165以上がでるようにする。
東北大学excel 課題1.間隔尺度データの基礎集計 参照
ここで改めて最頻値は?
選抜高校野球出場者のデータ の身長体重の代表値および散布度を求めよ。
タレントのデータと階級値で比較して見よ。
文部省の身長体重データと比較してみるとどうなるか?以上前回宿題
2 統計的仮説検定
2.1 統計的仮説検定の考え方
標本誤差→区間推定
『レジャー白書'92』の平成3年度日本の15歳以上の男女を母集団とした標本データ
| 母集団人数 | サンプル数 | パーセンテージ
|
男性 | 4976万人 | 1730人 | 28.9%
|
女性 | 5255万人 | 1799人 | 30.8%
|
このように大きい母集団(N)でサンプル数(n)がそれに比べて少ない時は、
p132 の
N−n
------------≒1.00
N−1
となり、95%の信頼区間での区間推定の式は次のようになる。
P±1.96*sqrt(P(100-P)/n)
この式で信頼区間を求め、テキスト p132の結果 28.9±2.1 と比較せよ。
この簡略式は標本の大きさが大きく、しかもπが極端に1や0に偏っていないときに有効。
目安として芝・南風原(1990)では次の基準を挙げている
nπ(1−π)>10
これを満たさないとき。 excel なら =CRITBINOM(100,0.40,0.025)、=CRITBINOM(100,0.40,0.975) を使う。=CRITBINOMは大きな値になるとオーバーフローするので近似式を使う。
信頼係数0.95の信頼区間 95%信頼区間
有意水準(有意水準)5% と%で言われることがあるが、αを使うときは0.05,0.01,0.001 などの確率で表すことが普通である。α=0.05として
このデータで「仕事にも余暇にも同じくらい力をいれる」と回答した比率は、母集団において男性よりも女性のほうが高いと言えるか?総理府世論調査 家庭内における家事・育児・介護の分担についての有識者の見解の有識者の分野によって意見が違うと言えるか?
2.2 統計的仮説検定の方法
表7.6
(1)統計的仮説検定の手順
(a)帰無仮説を設定する
帰無仮説:「比較する母集団特性値の間には差がない」
これが棄却されて、有意
(b)有意水準を決める 5% ただし、サンプルが多い場合はこれは甘いので1%
註:検定力
(c)どの計算公式を用いるか
(i)互いに従属なパーセントの差の検定
(ii)互いに独立なパーセントの差の検定
(iii)一部従属な差の検定
(iv)互いに独立な平均の差の検定
というのがテキストにあがっている。
すでに表になっている場合はテキストにある方法を使っても良いが、素データをもっている場合はあまり使うものではない。
それぞれ「有意」なときなどのことばの使い方は注意が必要。
《参考・引用文献》
井上文夫ほか 1995 よりよい社会調査をめざして 創元社(テキストといっている書)
杉山明子 1984 現代の統計3 社会調査の基本 朝倉書店
芝祐順・南風原朝和 1990 行動科学における統計解析法 東京大学出版会
香川大学 経済学部 堀 啓造(home page)