消費者調査法(第6回)11月12日課題


11月12日課題
p53-54 (1)から(8)の課題を実行せよ
(1),(5),(7)をレポートする.
問(1)から問(4)に答える
問(5)母集団が1億人の視聴率を調べたい.誤差を1%とするとき,予想される視聴率が10%,20%,30%,40%,50% の時の必要サンプルサイズを求め記せ.excel 等のプログラム可能な道具を使って良い.さらに,このことからなぜ母集団の比率が推定できないとき,50%(P=0.5)とおくのか考えて答えよ.
ヒント:10%の時はP=0.1 となる.

訂正: p51の(1)のn を求める式の適用において t=0.05としていましたが,t=1.96 の間違いでした.修正します.

作業
(1)
(7)452人→452÷961=0.4703 P=0.47

問題(1) 問題(2)
問題(3)は問題(1)から考えるが,答えが逆になっている例がある. 例えば  問(3)
問題(4) P=0.01 として適当なN,n を入れてεを計算し 95%信頼区間も求めて見よ.
問題(5)
p.53
2-1 系統抽出法と比率の推定



【作業】
(1)
数式に値をあてはめ、エクセルにより計算すると
fx=961/((((0.1/1.96)^2)*3840)+1)
87.39673がでる。
よって、必要標本規模は88以上となる。
絶対誤差が5%いないとした場合の標本規模は274.6531となり、
必要標本規模は275以上となる。

未知数であるからPを0.5と仮定するのは、
0.5と仮定しておけば誤差を最大に見積もったことになるからである。

(5)
(1)で必要標本規模を求めたのでそれを使い、
88人中の「支持政党なし」の標本比率を求める。

作業(2)より、N/nに数値を代入しLを求める。
961÷87.39=10.99...
整数部のみ使うので抽出間隔は10となる。
そこから調べていくと、支持政党なしは44人であったため、
44÷88=0.5
よって標本比率は0.5

(7)
全体においての「支持政党なし」の人数は452人であるので、
452÷961=0.4703...
P=047となる。

【問題】
(1)
Nを2倍にした場合の標本誤差は
エクセルにより
fx=100000000/((((0.05/1.96)^2)*399999996)+1)
=0.101891であったため、この値と、作業(6)によって求めた誤差
fx=1.96*SQRT(((961-88)/(961-1))*(0.47*(1-0.47)/88))
=0.99443
により標本誤差を求める。
0.101891÷0.099443=1.024624
よって1.02倍(小数第三位切り捨て)

Nとnを1/2とした場合の標本誤差は
N=480.5
n=44
となるのだから、
fx=1.96*SQRT(((480.5-44)/(480.5-1))*(0.47*(1-0.47)/44))
=0.140707
作業(6)で求めた誤差と比較し、
0.140707÷0.99443=1.414951
よって1.41倍(小数第三位切り捨て)

(2)
一億人を母集団とするとき母比率の推定誤差を0.05以内とするための必要標本規模
fx=100000000/((((0.05/1.96)^2)*399999996)+1)
=384.1585
最低385人必要ということになる。

20000人の場合
fx=20000/((((0.05/1.96)^2)*79996)+1)
=376.9386
最低377人必要ということになる。

(3)
1億人での標本誤差
fx=1.96*SQRT(((100000000-385)/(100000000-1))*(0.5*(1-0.5)/385))
=0.049
2万人での標本誤差
fx=1.96*SQRT(((20000-377)/(20000-1))*(0.5*(1-0.5)/377))
=0.049

標本規模による誤差よりも抽出比による作用の方が大きい。

(4)
たとえば、Pを99%や1%にした場合を考えてみる。
作業(6)の式に代入。
0.47を1にし計算すると誤差は0になる。⇒計算する必要がない。
逆に母集団を少なくした場合においても、
本来サンプル数が少ない場合誤差が大きくなるはずなのに0に近い数値が出る。
このようなありえない状態になるため。

(5)
10%の時
fx=100000000/((((0.01/1.96)^2)*1111111100)+1)
=3457.32
必要なサンプルサイズは3458

20%の時
=100000000/((((0.01/1.96)^2)*624999993.75)+1)
=6164.182
必要なサンプルサイズは6165

30%の時
=100000000/((((0.01/1.96)^2)*476190471.428)+1)
=8066.709
必要なサンプルサイズは8067

40%の時
=100000000/((((0.01/1.96)^2)*416666662.5)+1)
=9218.99
必要なサンプルサイズは9219

50%の時
=100000000/((((0.01/1.96)^2)*399999996)+1)
=9603.078
必要なサンプルサイズは9604

なぜ母集団の比率が推定できないとき50%とおくのか、
60%=9218.99
70%=8066.709
80%=6146.182
の比率からみて、50%とおくとき、抽出すべき個体数の値が最大値を示しており、
50%とおいた場合、一番信頼性のある値が出るからだと考えられる。






<作業>(1)n=88
    (2)N/n=10.92よりL=10
    (3)スタート番号S=1とする
    (4)抽出作業より、支持政党あり51、支持政党なし53、不明3
    (5)p=0.519
    (6)ε=0.0907<0.10
    (7)P=0.512 
    (8)P−ε=0,450、P+ε=0.574よりP−ε<p<P+εは成り立つ
<問題>(1)Nが2倍のとき1.03倍、Nもnも1/2のとき1.41倍
    (2)日本人の有権者を母集団とするときん=93、有権者数20
000人の都市の場合n=91
    (3)標本規模
    (4)わかりませんでした


作業(1)εが0.10の時の必要標本規模は、88(87.396…)人以上である。
     εが0.05の時の必要標本規模は、4(3.815…)人以上である。
  (5)L=10、ここではS=1とおく。p=44/97=0.4536…  よって、約45%である。
  (7)支持政党なしの回答者の数は452人。 P=452/961=0.470…  よって、約47%である。 

問題(1)Nが2倍であっても標本誤差はほとんど変わらない。
     また、Nもnも1/2にすると、標本誤差は2倍になる。
  (2)1億人の場合の必要標本規模は、385(384.1…)人以上となる。
     20
000人の場合の必要標本規模は、377(376.938)人以上となる。
  (3)標本誤差を大きくする作用は標本規模の方が大きい。
  (4)誤差の推測が過小であるから。と思いましたが、よくわかりませんでした。
  (5)10%のとき、3458(3457.32…)人以上である。
     20%のとき、6147(6146.18…)人以上である。
     30%のとき、8067(8066.72…)人以上である。
     40%のとき、9219(9218.99…)人以上である。
     50%のとき、9604(9603.07…)人以上である。
     50%とおくと、半分の人が視聴している事となり、平均的な数値が期待されるから、
     母集団比率が推定できないときは、P=0.5とおく。

(1)計算によりεが0.10以内となる時の必要標本規模はn≧87.396……となり、nは整数である  ∴n≧88
 計算によりεが0.05以内とした場合の必要標本規模はn≧3.81……となり、∴n≧4

(5)標本比率を求めるためにスタート番号をここで1とする。また、N/n(961/88)が10.92……となることからLを10とする。3.2の仙北調査結果のサンプル番号001から10間隔毎に標
 本を抽出し、97の標本のうち「支持政党なし」と答えた人が44人いたことから、p=44/97≒0.45という結果が出た。 ∴p=45%

(7)母集団961の内「支持政党なし」と答えた人は452人いることから、P=452/961≒0.47となる。 ∴P=47%

問題
(1)Nが2倍であるとき、標本誤差はほとんど変わらない。また、Nが1/2のとき(抽出日はそのまま)標本誤差はおよそ2倍になる。

(2)有権者が1億人のときn≧384.1…… ∴n≧385 
 有権者が2万人のときn≧376.93…… ∴n≧377

(3)標本誤差を大きくする作用は標本規模による。

(4)標本誤差が均一に出ないことが推測されるから。だと考えましたが、確固とした根拠がわかりませんでした。

(5)10%のときn≧3458
 20%のときn≧6147
 30%のときn≧8067
 40%のときn≧9219
 50%のときn≧9604

 Pの変域の内で、P=0.50のときに最大値0.25をとるので、εもまた最大値となる。Pを0.50と仮定しておけば、誤差を最大に見積もったことになり、安全であるから。(教科書  
 p.57を参照)ここから導き出される結果ではわかりませんでした。


(1)
(2.1)の式に
  N=961 e=0.10 t=1.96 P=0.5 を代入すると、
  n≧87.396
  n はこれを満たす整数なので
  n≧88

  e が5%以内とした場合
  (2.1)の式に
N=961 e=0.05 t=1.96 P=0.5 を代入し、
  n≧274.65
n はこれを満たす整数なので
  n≧275

(5)
(2)(3)で
  L=10 S=8(ランダム)
抽出した数96
  無党派層の数54
  
  54/96=0.563 p=0.56

(7)
(6)で、e=0.094
  (2.1)の式を変形
  P(1-P)=(N-1)/(N-n)/{n・(e/t)2乗}
  教科書p.57の(2.2)の変形式
  P(1-P)=-(P-1/2)2乗+1/4

(N-1)/(N-n)/{n・(e/t)2乗}=-(P-1/2)2乗+1/4
この式を解くと P=0.57

問1
Nが2倍
  (2.2)の式に
  N=1922 n=96 P=0.57 を代入
  e=0.004756
約0.5倍

  Nもnも1/2
(2.2)の式に
  N=481 n=48 P=0.57 を代入
  e=0.009028
約1倍

問2
  (2.1)の式に
  N=100000000 e=0.05 t=1.96 P=0.57 を代入
  n≧377.07
n はこれを満たす整数なので
  n≧378

(2.1)の式に
  N=20000 e=0.05 t=1.96 P=0.57 を代入
  n≧370.37
n はこれを満たす整数なので
  n≧371

問3
  抽出比の方が標本誤差を大きく作用する

問4
  解りませんでした。

問5
  (2.1)の式に
  N=100000000 e=0.01 t=1.96 を代入
  P=0.1のとき n≧3458
  P=0.2のとき n≧6147
P=0.3のとき n≧8067
P=0.4のとき n≧9219
P=0.5のとき n≧9604
必要サンプルサイズは、視聴率10%のとき3458人
  20%のとき6147人 30%のとき8067人
  40%のとき9219人 50%のとき9604人


p53〜54【作業】
(1)推定値の絶対誤差が10%以内の時の必要標本規模n
961/[(0.1/1.96)^2*{(961-1)/0.5(1-0.5)}+1]
=961/{(0.01/3.8416)*(960/0.25)+1}
=961/(9.6/0.96+1)
=961/11
=87.3636
≒87
n≧87
推定値の絶対誤差が5%以内の時の必要標本規模n
961/[(0.05/1.96)^2*{(961-1)/0.5(1-0.5)}+1]
=961/(2.4/0.9604+1)
=961/3.5
=274.57
≒275
n≧275
(5)標本における支持政党なしの人数は37人であった。よって、
37/87=0.42528
≒0.425
つまり42.5%
(7)母集団における支持政党なしの人数は452人であった。よって
452/961=0.4703
≒0.47
つまり47%

【問題】
(1)・Nが2倍の時
e=1.96√{(1922-87)/(1922-1)}*{0.47(1-0.47)/87}
=1.96√(1835/1921)*(0.2491/87)
=1.96√457.098/167127
=1.96√0.002735
=1.96*0.052
=0.10192
≒0.10
【作業】(6)で求めた標本誤差が0.098≒0.1だったので、それと比べると標本誤差は1倍である。

・Nもnも1/2の時
e=1.96√{(481-44)/(481-1)}*{0.47(1-0.47)/44}
=1.96√(437/480)*(0.249/44)
=1.96√108.813/21120
=1.96√0.005152
=1.96*0.072
=0.14112
≒0.14
0.14/0.1=1.4 つまり1.4倍である。

(2)有権者1億人を母集団とし、母比率の推定誤差を0.05以内とするための必要標本規模
n≧100000000/[(0.05/1.96)^2*{(100000000-1)/0.5(1-0.5)}+1]
=100000000/{(0.0025/3.8416)*(99999999/0.25)+1}
=100000000/{(249999.9975/0.9604)+1}
=100000000/260309
≒384
n≧384
有権者数20000人の都市の場合
n≧20000/[(0.05/1.96)^2*{(20000-1)/0.5(1-0.5)}+1]
=20000/{(0.0025/3.8416)*(19999/0.25)+1}
=20000/(49.9975/0.9604+1)
=20000/53.05
≒377
n≧377

(3)標本規模
(4)標本数が足りていなくても、標本誤差が低くなぅてしまうから?よくわかりませんでした。
(5)必要標本規模を求める公式にあてはめて考えた。
・視聴率10%の時
n≧100000000/[(0.01/1.96)^2*{(100000000-1)/0.1(1-0.1)}+1]
100000000/{(0.0001/3.8416)*(99999999/0.09)+1}
=100000000/(10000/0.3457+1)
=100000000/28298
≒3457
n≧3457
・視聴率20%の時
p=0.2に置き換えて計算すると、
n≧6146
・視聴率30%の時
p=0.3に置き換えて計算すると、
n≧8066
・視聴率40%の時
p=0.4に置き換えて計算すると、
n≧9219
・視聴率50%の時
p=0.5に置き換えて計算すると、
n≧9603

母集団の比率が推定できない時、50%(p=0.5)とおくのは、pが極めて小さい値であったり大きい値であったりした場合、必要標本規模が
小さくなってしまうからである。

【作業】
(1)
・推定値の絶対誤差εが10%以内の場合
 N=961、ε=0.10、t=1.96、P=0.50を(2.1)の式に代入し、計算した。
 n≧88となり、必要標本規模nは88人以上と決定した。
・推定値の絶対誤差εが5%以内の場合
 N=961、ε=0.05、t=1.96、P=0.50を(2.1)の式に代入し、計算した。
 n≧275となり、必要標本規模nは275人以上と決定した。

(5)
 抽出間隔L=10、抽出のスタート番号S=8と決定し、系統抽出を行うと96人が抽出され、その中から「支持政党なし」の人数を数
えた結果、53人であった。
 よって、標本比率(「支持政党なし」の比率)p=0.55となる。

(7)
 母集団は961人、その中から「支持政党なし」の人数を数えた結果、452人であった。
 よって、母比率(「支持政党なし」の比率)P=0.47となる。

【問題】
(1)
 上の例において(N=961、n=88、P=0.47、t=1.96)、標準誤差εを求めた結果、
ε=0.098  ・・・a
となった。

・Nが2倍の場合
 N=1922、n=88、P=0.47、t=1.96より標準誤差εを求めた結果、
ε=0.101  ・・・b
となった。a、bより、Nが2倍の場合、標準誤差は1.03倍になる。

・Nとnが1/2の場合
 N=480.5、n=44、P=0.47、t=1.96より標準誤差εを求めた結果、
ε=0.141  ・・・c
となった。a、cより、Nとnが1/2の場合、標準誤差は1.43倍になる。

(2)
・有権者1億人が母集団の場合 
 N=1億、ε=0.05、t=1.96、P=0.50として【作業】の(2.1)の式に代入し、計算した。
 n≧385となり、必要標本規模は385人以上である。

・有権者20,000人が母集団の場合
 N=20000、ε=0.05、t=1.96、P=0.50として【作業】の(2.1)の式に代入し、計算した。
 n≧377となり、必要標本規模は377人以上である。

(3)
(1)の問題より、抽出比が変わる場合より、標本規模が変わった場合の方が標本誤差を大きくしていることがわかる。
 よって、標本誤差を大きくする作用は、標本規模の方が大きい。

(4)わかりませんでした。

(5)
 視聴率が10%の場合
 N=1億、ε=0.01、t=1.96、P=0.1として【作業】の(2.1)の式に代入し、計算した。
 n≧3458となり、必要サンプルサイズは3458人以上である。
 同様に計算すると、20%の場合6147人以上、30%の場合8067人以上、40%の場合9219人以上、50%の場合9604
人以上のサンプルサイズが必要となった。

 この結果、母比率50%の時の必要サンプルサイズが一番大きくなっていることがわかる。必要標本規模を求める式の中に、P(1−
P)が含まれていることから、母比率10%と90%は同じ必要標本規模になる。同様に20%と80%も同じである。よって、今後母比
率60%、70%・・・のときの必要標本規模を求めても、50%の時が一番大きくなる。【問題】(1)のように、標本規模が小さくな
ると、標準誤差が大きくなるので、標本規模は大きい方が良いことがわかる。これらのより、母集団の比率が推定できないとき、50%
(P=0.5)とおくと考えられる。

【作業】
(1)
N=961、ε=0.10、t=1.96、P=0.5を(2.1)式に当てはめて計算する。
すると、n>=87.49となる。
つまり、必要標本規模は88人以上である。
εを5%以内とする場合には、ε=0.05を当てはめて計算する。
すると、n>=38.50となる。
つまり、必要標本規模は39人以上である。
(5)
スタート番号S=5、抽出間隔L=10で系統抽出を行ったところ、96人が抽出された。
そのうち「支持政党なし」の者は44人。
よって、標本比率p=0.46となる。
(7)
母集団961人のうち、「支持政党なし」の者は451人。
よって、母比率P=0.47となる。

【問題】
(1)
Nを2倍の1922で計算してみると、ε^2=0.0095となった。
元のε^2=0.0088であるので、標本誤差は1.079倍となる。
また、Nを2/1の480.5として、nを2/1の48として計算すると、
ε^2=0.0180となるので、標本誤差は2.0455倍となる。
(εは二乗したほうが比較しやすいので二乗のものを書いてある。)
(2)
N=1億、ε=0.05で当てはめて計算したところn>=384.61となったので、
必要標本規模は385人である。
また、N=20000で当てはめて計算すると、n>=377.38となったので、
必要標本規模は378人である。
(3)
(1)と(2)より、標本規模のほうが抽出比より標本誤差を大きくする作用があることがわか
る。
よって、標本規模。
(4)
考えてみましたが、わかりませんでした。
(5)
N=1億、ε=0.01、Pはそれぞれ変化させて計算する。
視聴率10%のとき、N>=3461.42となり、必要標本規模は3462人である。
視聴率20%のとき、N>=6153.47となり、必要標本規模は6154人である。
視聴率30%のとき、N>=8076.27となり、必要標本規模は8077人である。
視聴率40%のとき、N>=9229.92となり、必要標本規模は9230人である。
視聴率50%のとき、N>=9614.46となり、必要標本規模は9615人である。


作業
(1)N=961、ε=0.10、t=1.96、P=0.50を(2.1)の式に当てはめて計算する。
  すると、n≧87.39・・・となり、必要標本規模は88人となった。
  次に、εを5%以内とした場合の必要標本規模と求めた。
  この場合、N=961、ε=0.05、t=1.96、P=0.50となり、これを当てはめて計算する。
  すると、n≧274.65・・・となり、必要標本規模は275人となった。

(5)(2)で求められた抽出間隔L=10と(3)で抽出のスタート番号S(S≦L)をランダムに決定して資料   
  3.2の支持政党の数を数えたところ96人であった。
  そのうち、支持政党なしの数は53人であった。
  これによって支持政党なしの標本比率pを求めたところ、p=0.5520・・・となり、支持政党なしの標本比 
  率p=0.55となる。

(7)母集団961人について支持政党なしの数を数えたところ、支持政党なしは452人であった。  
  これより、母比率(支持政党なしの比率)Pを求めるとP=0.47・・・となり、母比率P=0.47となる。
   
問題
(1)(2.2)の式においてNが2倍であったときの標本誤差を求める。
  このとき、N=1922になり、(2.2)の式に当てはめて計算すると、ε^2=0.0104・・・となる。
  元の標本誤差ε^2=0.0090・・・であるから、この2つを比べると、標本誤差は1.15倍となった。
  次に、Nもnも1/2であったときの標本誤差を求めた。
  このときN=481、n=44になり、同じく(2.2)の式に当てはめて計算すると、ε^2=0.0198・・・とな  
  る。これを元の標本誤差と比べると、2.2倍となった。

(2)N=100000000、ε=0.05、t=1.96、P=0.5を(2.1)の式に当てはめて計算する。
  すると、n≧384.1・・・となり、必要標本規模は385人となる。
  次に、N=20000、ε=0.05、t=1.96、P=0.5を当てはめて計算すると、
  n≧376.9・・・となり、必要標本規模は377人となる。

(3)標本規模
 
(4)分かりませんでした。

(5)母集団が1億人の予想される視聴率が以下の場合の視聴率を調べる。このとき、誤差を1%とするから、
  N=100000000、ε=0.01、t=1.96、P=0.5となる。(2.1の式に当てはめて計算する)
  予想される視聴率が
  10%のとき、n≧3457.3・・・となり、必要サンプル数は3458人となる。
  20%のとき、n≧6146.1・・・となり、必要サンプル数は6147人となる。
  30%のとき、n≧8066.7・・・となり、必要サンプル数は8067人となる。
  40%のとき、n≧9218.9・・・となり、必要サンプル数は9219人となる。
  50%のとき、n≧9603.0・・・となり、必要サンプル数は9604人となる。             
 


(1)n≧87.3967276758
   ε=0.05のとき ∴n≧274.81012079

(5)∴p=0.44

(7)P=0.469302… ∴P=0.47

問題
(1)Nが二倍のとき、標本誤差も二倍になる。Nもnも1/2になるとき、標本誤差も1/2になる。

(2)
有権者が一億の場合
N=100000000 ε=0.05 t=1.96 P=0.5として
n≧100000000/(0.05/1.96)2乗×100000000-1/0.5(1-0.5)+1
n≧277.7777…
∴n≧277.8

有権者が二万の場合
N=20000 ε=0.05 t=1.96 P=0.5として
n≧20000/(0.05/1.96)2乗×20000-1/0.5(1-0.5)+1
n≧273.986114…
∴n≧273.99

(3)抽出比が多いほど誤差は減るから、抽出比に作用される。

(4)母比率Pが最大でも最小でも、必要標本規模は最小になるため、データの信頼性にかけるから。

(5)N=100000000 ε=0.01 t=2.575 で、P=0.1.0.2,0.3、0.4
0.5としていく。
P=0.1のとき
n≧100000000/(0.01/2.575)2乗×100000000-1/0.1(1-0.1)+1
n≧5625.0000…
∴n≧5625.0

P=0.2のとき
n≧100000000/(0.01/2.575)2乗×100000000-1/0.2(1-0.2)+1
n≧10000.0001…
∴n≧10000.0

P=0.3のとき
n≧100000000/(0.01/2.575)2乗×100000000-1/0.3(1-0.3)+1
n≧13123.2777701…
∴n≧13123.3

P=0.4のとき
n≧100000000/(0.01/2.575)2乗×100000000-1/0.4(1-0.4)+1
n≧14997.7504874…
∴n≧14997.6

P=0.5のとき
n≧100000000/(0.01/2.575)2乗×100000000-1/0.5(1-0.5)+1
n≧15622.5591313…
∴n≧15622.6

P=0.6とP=0.4は同じ答えになる。nはP=0.5を境にだんだん小さくなっていくと考えられる。つまり、P=0.5が最大必要標本規模となるから。

質問:作業の(3)に関する質問があります。ランダムに決定する方法をエクセルで試みたところ、毎回違う数値が出ました。これは何を意味しているのですか。

作業
(1)n≧87.399231
 ε=0.05のとき  215.66427289048473967684021543986
 
(5)p=0.53125

(7)P=450÷961   ∴0.47

問題
(1)Nが二倍のとき、εは二倍
   Nもnも1/2のとき、εも1/2

(2)n≧100
000
000/(0.05/1.96)2乗×{(100
000
000ー1)/0.5×0.5}+1
   ≧277.777777777…
                            ∴約278
 有権者二万人の場合
  n≧20
000/(0.05/1.96)2乗×{(20
000ー1)/0.5×0.5}+1
   ≧277.78819205720214508044051651937

(3)2からは分からなかったが、1から考えて、抽出費の作用が大きいと考えられる。母集団の大きさにかかわらず、抽出費が大きけ
 れば大きいほど、誤差は小さくなり、抽出費が小さければ誤差は大きくなると考えられる。
(4)Pが大きいときや、小さいときは、必要標本比率nの値小さくなるため、そこから得られる結果の信憑性はきわめて低いと考えれ
 れるため。(教科書のP165のαの部分に当たる??)

(5)Pの値を0.1、0.2、0.3、0.4、0.5と変化させていく
 n≧100
000
000/(0.01/2.275)2乗×{(100
000
000ー1)/P(P-1)}+1
 0.1のとき
   n≧5624.9
 0.2のとき
   n≧10000
 0.3のとき
   n≧13125
 0.4のとき
   n≧15000
 0.5のとき
   n≧15625
これらの結果から推測すると、n増加率はだんだん小さくなっている。また、0.6の場合を計算すると、0.4のときのnの値と一致す
る。つまり、0.5のときが一番必要標本規模の値が大きくなる。そのため、一番信頼度の高いデータが取れると考えられる。



11月12日課題
(1)
N≧87.399231
(5)
N/n=10.99552 L=10 S=9とするとp=0.1875 
(7)
P=451/961=0.469303
問題1〜5はわかりませんでした。


(1)n≧20.9916701
(2)N/n=45.7619048 L=45
(3)S=3
(4) 003不明 048民主 093自民 138社民 183社民 228なし 273自民 318自由
   363民主
   408なし 453なし 498社民 543不明 588なし 633なし 678なし 723自民
   768なし
   81なし 858なし 903共産 948なし
(5)標本比率p=10/22
(6)標準語差0.2050424 おさまっていない
(7)母比率P=442/961
(8)標準語差0.205233 成立する

問(1)Nが2倍なら、標本誤差はほとんど変わらず  Nもnも1/2なら、標本誤差は1.5倍

問(2)約1億人 385人  2万人 385人
問(3)抽出比
問(4)きわめて大きい場合や、きわめて小さい場合は、5%の確立に含まれ、偏りであるから成立しない。
問(5)10%のとき3458人 20%のとき6147人 30%のとき8067人 40%のとき9219人
 50%のとき9604人
  計算上、P=0.5とおくとサンプルサイズが一番大きくなるから=信頼性が高くなるから
<
作業(1)P=0.5 N=961 t=1.96 誤差の最大値=0.10より(2.1)の公式を使うとn≧87.25
また、絶対誤差が5%の場合もどうようにするとn≧274.88
(5)N/nが作業(3)より10とでるので乱数でとっていくと抽出個数が96となる。そして支持道理抽出すると、スタート番号9か
ら10番目ごとに支持なしは39人であった。つまり標本比率p=39/96=0.406≒0.41となる
(7)全体における支持なしは452人であったのでP=452/961=0.470≒0.47となる
問題(1)作業で使った値のNの値を1/2にして計算するとN-n/N-1*P(P-1)/n=0.0020となる。作業より元の値は0.0023これより約
0.87倍これに√がつくので約√0
87倍となる。またNとnが1/2のときも同様に計算するとN-n/N-1*P(P-1)/n=0.0046これより約√2
倍となる
(2)N=100
000
000のとき (2.1)の式よりn≧399.998
N=20.000のときも同様に計算してn≧392.17
(3)抽出比がかわっても標本規模はあまりかわらず、標本誤差の差が大きくなる。つまり抽出比のほうが標本誤差の大小に作用しや
すい
(4)かりにP=0.00001とすると問題(1)で使った式が値が小さすぎて計算できなくなるため。また仮に大きすぎても問題(1)の式よりP
(1-P)の答えは同じようになるので大きすぎても小さすぎてもだめである。
(5)視聴率が10%のとき(2.1)の式よりn≧3460.08
視聴率が20%のときn≧615.144
視聴率が30%のときn≧807.387
視聴率が40%のときn≧922.713
視聴率が50%のときn≧961.15

前回の課題の(1)は一応全部答えたつもりなのですが何が欠けているのですか?

p53
(1)必要標本数nを計算するとn=87.36224315と出たので式の条件に当てはめてn=88
Pが0.5の時にεも最大になり誤差がこれ以上大きくなることが無く計算できるのでPを0.5とした。
(5)N/nをして抽出間隔Lを求める。L=10.92045455と出たので整数部の10を抽出間隔とする。
   抽出のスタート番号sをINT(RAND()*10)+1で計算しs=3とした。
   スタート番号s=3、抽出間隔L=10として系統抽出を行い途中で(1)で計算した必要標本数88に達
   したが個体リストの最後まで到達していなかったので最後まで抽出を続けそれを含めて標本を96とし抽
   出した標本の中で支持政党なしの標本は49個あった。支持政党なしの標本比率pは49/96でp=
0.510416667と出たのでp=0.51とした。
(7)標本誤差を教科書p54の(2.2)式で(Nを961、nを96、tを1.96、Pは標本比率pの  
   0.51を代用して)求めるとε=0.094922382と出た。教科書p56の真ん中の式に当てはめると母比率P
   は0.41<=P<=0.59の間の中にある確立が95パーセント以上と推定される。
p54
問題1 Nが2倍になった時の標本誤差は0.099701056 Nがそのままの時の標本誤差が0.099600605なのでNが
    2倍になった時の標本誤差は1.001008533倍となる。約1.001倍
    N、nともに半分になった時の標本誤差は0.147481086となりそのままの時の1.480724805となる。約 
    1.4807倍。
問題2 母集団の大きさNを一億人、誤差の最大値εを0.05、tを1.96、Pを0.5として計算すると必要
    標本数nは385。有権者数20000人の場合の必要標本数は377となる。
問題3 問題1、2より標本誤差を大きくするのは標本規模ということが分かる。
問題4 母比率を極めて小さくするということはつまり0に限りなく近づけるということで教科書p54の  
    (2.2)式の誤差が0に限りなく近くなり区間推定ができなくなるから。逆に極めて大きくするときは
    1に限りなく近づくことになる。
問題5 母集団の大きさNを1億人、誤差εを0.10としtを1.96としてPは視聴率に応じて変     
    化させて必要サンプルサイズを求めた。
    必要標本数はそれぞれ50%の時9604 40%の時9219 30%の時8067 20%の時 
    6147 10パーセントの時3458となる。母集団の比率が推定できない時母比率を大きくとった
    ほうが誤差の値を大きくみつもることになり正確な計算ができる。

p53-54作業
(1)
n>=961/(0.05/1.96)^2*{961−1/0.5(1−0.5)}
(0.05/1.96)^2=0.00065077051
0.00065077051*(960/0.25)+1=3.4989587584
n>=274.65313722
(2)
961/274.65313722=3.4989・・・
抽出間隔 L=3
スタート番号 S=3

(5)支持政党なし147個
抽出標本数 961/3=320.33
標本比率 p=147/320=0.459375

(6)標本誤差 ε=1.96√{(961−320)/960}*{p(1−p)/320}
           =1.96√0.00051820344=0.00026438951
(7)母集団についての母比率 P=449/961=0.46722164412
(8)標本誤差 ε=1.96√{(961−n)/(961−1)}*{P(1−P)/n}
           =1.96√0.000099509579
           =0.009080177

  P−ε<=p<=P+ε
  0.44537505417<=0.459375<=0.48906823407

問題(1)
・Nが2倍 961*2=1922

n>=1922/(ε/t)^2*{(1922−1)/P(1−P)+1}
  =319.1575565

ε=t√{(N-n)/(N-1)*P(1−P)/n}
 =1.96√0.00065077051 =0.92641705200

Nが2倍の時のε/Nの時ε=0.92641705200/0.0090810177=102.02632085278
標本誤差は102倍

・Nが1/2 =480.5
nが1/2 =137.32656861

ε=1.96√0.00456297522 =0.06393502389

N半分のε/Nの時のε=0.06393502389/0.0090810177 =7.04116493400
標本誤差は7倍

(2)
N=100000000(1億)人
n>=382.50754052560
ε=1.96√99999617.49/99999999*0.51892557939/382.50
 =1.96√0.00065077051 
 =0.02366997995  
ε<=0.05である。
必要標本規模 n>=382.51

N=2000人
n>=321.23246484890
ε=0.02366997955

(3)
(1)から標本誤差を大きく(小さく)作用するのは、標本規模である。

(4)
母比率P、標本比率pが極めて大きい(小さい)時に成立しないのは、
母集団の「縮図」となる可能性が低いからだと思う。
標本統計量のとる値の出現確率の分布が理論的に知られていて、
それに当てはまらないため、母集団統計量の推定が出来ないのだと思う。

(1)ε=0.10のとき n=88
  ε=0.05のとき n=275

(5)支持政党なしは961人中452人のため p=452/961=0.47 となる

(7)分かりませんでした

問題
(1)分かりませんでした

(2)分かりませんでした

(3)分かりませんでした

(4)分かりませんでした

(5)分かりませんでした

前回の講義に出席したのにも関わらず、今回の課題は全く分かりませんでした。
次回の講義で理解できるようにしたいと思います。

【作業】
(1)P.53の(2.1)式において、N=961 t=1.96 ε=0.1 P=0.5 である。よってn≧87.396727…となり、n=88
また、ε=0.05のときn≧275.6531…となり、n=275
(5)p=49/96=0.51
(7)P=451/961=0.46875 よって47%
【問題】
(1)P.54の(2.2)式において、N=1922のときε=0.10189…となる。作業の(6)より、ε=0.097…となるので、よって標本誤
差は1.02倍となる。
また、N=480.5 n=44のときε=0.14070となる。よって標本誤差は1.41倍となる。
(2)N=100000000 ε=0.05のとき、P.53の(2.1)式より、n=385
また、N=20000のとき、n=377
(3)(1)の結果より、抽出比が2/1のとき標準誤差は1.02倍だが、標本規模が2/1のときは1.41倍となっている。このことから、標
本誤差を大きくする作用は標本規模のほうが大きいと考えられる。
(4)極めて大きいときや極めて小さいときは、必要標本規模が少ないため、誤差の幅がε≧0.10におさまらなくなるため(2.2)式は
成立しなくなる。
(5)N=100000000 ε=0.01 
P=0.1のとき、n=34562.478…
P=0.2のとき n=61427.849…
P=0.3のとき n=80608.581…
P=0.4のとき n=92113.483…
P=0.5のとき n=95947.862…
P=0.6のときはn=92113.483…となりP=0.4と等しくなることからも分かるように、P=0.5のときが必要サンプルサイズの最大値
となり誤差が一番少なくなるため、P=0.5とおくのが良いと考えられる。

作業(1)N=961,ε=0.1,t=1.96,P=0.5の場合
   n≧87.396・・・となり、
      必要標本規模は88人となる。
   また、ε=0.05の場合
   n≧274.653・・・となり、
      必要標本規模は275となる。

  (5)L=10(L=961/88=10.9204・・・),S=1(INT(RAND()*10)+1)より、
   標本比率p=47%(46/97=0.47422・・)

  (7)母比率P=47%(452/961=0.4703・・・)


問題(1)N=1922のとき、標本誤差は1.05倍でとなる。(0.009373/0.00888)
  
以下、解けませんでした。
       
<
提出が遅れてすみません。

作業
(1)
絶対誤差10%以内の場合 
 n≧90.66
 以上より、必要標本規模nは91である
絶対誤差5%以内の場合
 n≧3.68
 以上より、必要標本規模nは4である

(2)
N/n=961/92=10.44
よって、抽出間隔Lは10である

(3)
http
//www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/randomtab.htmlの乱数表より、S=5に決定する

(5)
標本抽出数 96
支持政党なし 44
005、015、025、035、065、085、105、145、175、185、195、265、285、295、335、345、355、365、395、405、425、435、455、
475、505、525、535、615、625、655、675、685、705、745、755、765、805、815、825、845、855、905、915、925
標本比率p=44/96=0.458≒0.46

(6)
標本誤差=0.09より、定めた誤差の範囲内におさまっている

(7)
通常標本比率と母比率は一致することより、母比率Pは0
46である

(8)
p=0.46
P−標本誤差=0.46−0.09=0.37
P+標本誤差=0.46+0.09=0.55
よって、0.37≦p≦0
55となり、成立する

問題
(1)
Nを2倍にした標本誤差=0.143より、1.59倍になる
Nもnも2/1倍にした標本誤差=0.137より、1.52倍になる

(2)
日本全体の有権者を母集団とする場合 357人
有権者数20
000の都市の場合     351人

(3)
標本規模

<
すいません。遅れてしまいました。

(1)絶対誤差が0.10以内の場合
  n≧89.669 
  より、四捨五入して90となる。

  絶対誤差が0.05以内の場合
  n≧274.653
  より、四捨五入して275となる。

(5)抽出間隔を10、スタート番号を5で系統抽出を行った場合、
 標本抽出数が96で、この中で支持政党なしの数は44であった。
 標本比率は 44/96=0.458
より、p=0.46 である。

(7)母集団の総数は961であり、その中で支持政党なしの数は452である。
 母比率は 452/961=0.470
より、P=0.47 である。

問題(1)Nが2倍の場合、標本誤差は1.40倍となる。
    N、n共に1/2の場合、標本誤差は1.56倍となる。

問題(2)求めることができませんでした。