Wilcoxon < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) überfällig | Datum: | 15:26 Mi 06.06.2012 | Autor: | dennis2 |
Aufgabe | Die folgenden historischen Daten geben das mittlere Alter in Tagen von preußischen Kindern an, die innerhalb des ersten Lebensjahres gestorben sind:
[mm] \textbf{männlich, legitim // illegitim}:
[/mm]
1882: 111,71 // 96,39
1883: 112,91 // 100,04
1884: 114,07 // 98,86
1885: 113,91 // 98,15
1886: 117,15 // 101,79
1889: 112,97 // 98,00
1890: 114,62 // 100,53
1891: 110,96 // 96,37
1894: 113,61 // 98,15
1895: 111,89 // 98,58
1896: 111,67 // 95,85
Zur Erklärung: Zuerst steht das Jahr, dann männlich-legitim und dann männlich-illegitim.
[mm] \textbf{weiblich, legitim // illegitim}
[/mm]
1882: 117,89 // 104,17
1883: 117,72 // 103,80
1884: 119,70 // 103,09
1885: 119,34 // 106,26
1886: 121,46 // 108,91
1889: 118,28 // 104,72
1890: 122,99 // 109,05
1891: 116,26 // 102,54
1894: 119,23 // 104,16
1895: 116,89 // 104,07
1896: 116,83 // 101,78
Untersuchen Sie mithilfe des Wilcoxon-Zweistichproben-Rangtests [mm] ($\alpha=0,05$) [/mm] anhand der obigen Daten, ob
(1) die männlichen Kinder zum Zeitpunkt ihres Todes jünger sind als die weiblichen,
(2) die illegitimen Kinder zum Zeitpunkt ihres Todes jünger sind als die legitimen. |
Hallo, liebe Helferinnen und Helfer!
Ich habe noch nie mit dem Wilcoxon-Zweistichproben-Rangtest gearbeitet. Wenn ich das korrekt verstanden habe, kombiniert man jetzt erstmal die Stichproben und ordnet sie.
Dabei nehme ich an, daß [mm] $X_1,\hdots,X_{22}$ [/mm] das Alter der männlichen Kinder bezeichnen sollen, daß [mm] $X_1,\hdots,X_{22}$ [/mm] die stetige Verteilungsfunktion F haben, daß [mm] $X_{23}\hdots,X_{44}$ [/mm] das Alter der weiblichen Kinder bezeichnen und stetige Verteilungsfunktion G haben.
Zudem seien [mm] $X_1,\hdots,X_{44}$ [/mm] unabhängig.
-------------------
Nun erstmal zu (1):
Die Nullhypothese ist:
[mm] $H_0: [/mm] F(z)=G(z)$.
Die Alternativhypothese muss hier m.E. lauten:
[mm] $H_1: G(z)=F(z-\theta)~\forall z\in\mathbb{R}, \theta<0$
[/mm]
Wenn ich das korrekt verstanden habe, schreibt man jetzt erstmal die kombinierte geordnete Stichprobe hin und merkt sich jeweils, ob die Variable aus [mm] $X_1,...,X_{22}$ [/mm] oder aber aus [mm] $X_{23},...,X_{44}$ [/mm] stammt.
Im ersten Fall "merkt" man sich eine 0, im zweiten Fall eine 1.
Die kombinierte geordnete Stichprobe lautet (daneben steht die 0 oder die 1):
95.85 // 0
96.37 // 0
96.39 // 0
98.00 // 0
98.15 // 0
98.15 // 0
98.58 // 0
98.86 // 0
100.04 // 0
100.53 // 0
101.78 // 1
101.79 // 0
102.54 // 1
103.09 // 1
103.80 // 1
104.07 // 1
104.16 // 1
104.17 // 1
104.72 // 1
106.26 // 1
108.91 // 1
109.05 // 1
110.96 // 0
111.67 // 0
111.71 // 0
111.89 // 0
112.91 // 0
112.97 // 0
113.61 // 0
113.91 // 0
114.07 // 0
114.62 // 0
116.26 // 1
116.83 // 1
116.89 // 1
117.15 // 0
117.72 // 1
117.89 // 1
118.28 // 1
119.23 // 1
119.34 // 1
119.70 // 1
121.46 // 1
122.99 // 1
Wie gesagt: Ich habe immer eine 1 vergeben, wenn die Variable aus [mm] $X_{23},...,X_{44}$ [/mm] stammt, sprich: "weiblich" ist.
Ich komme dann für die Teststatistik [mm] $W_{44}$ [/mm] auf:
[mm] $W_{44}=\sum_{i=1}^{44}i\cdot Z_i=11+13+14+15+16+17+18+19+20+21+22+33+34+35+37+38+39+40+41+42+43+44=612$
[/mm]
Nun muss ich doch [mm] $H_0$ [/mm] ablehnen, wenn [mm] $W_{44}=612\geq w_{1-\alpha}=w_{0.95}$?
[/mm]
Zwei Fragen:
1.) Stimmt das bis hierher?
2.) Wie bekomme ich jetzt [mm] $w_{0.95}$ [/mm] her? Tabellierung? (s. Mitteilung, ich habe als kritischen Wert 566 heraus.)
Was, wenn ich eine 1 vergebe, wenn die Variable aus [mm] $X_{1},...,X_{22}$ [/mm] stammt und eine 0, wenn sie aus [mm] $X_{23},...,X_{44}$ [/mm] stammt?
Dann komme ich auf:
[mm] $W_{44}=378$.
[/mm]
Im anderen Fall auf [mm] $W_{44}=612$.
[/mm]
Kann das sein? Dann könnte ich im ersten Fall die Nullhypothese nicht ablehnen, im zweiten Fall aber schon. Das verwirrt mich gerade, denn ich dachte, es ist egal, nach welchem Prinzip man seine 0 und seine 1 vergibt...
Viele Grüße
Dennis
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:55 Mi 06.06.2012 | Autor: | dennis2 |
Ich habe in einer Tabelle für den linksseitigen Test abgelesen:
[mm] $w_{0.05}=424$.
[/mm]
Dann erhalte ich doch für meinen Test hier, der ja rechtsseitig ist, den kritischen Wert als:
[mm] $2\mu-424=990-424=566$
[/mm]
Falls das stimmt, so ist die Nullhypothese also abzulehnen, da 612>566.
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 19:07 Mi 06.06.2012 | Autor: | dennis2 |
Also wir hatten die Teststatistik so definiert:
[mm] $W=\sum_{i=m+1}^{N}R_i$
[/mm]
Und dies ist doch identisch mit
[mm] $\sum_{i=1}^{N}iV_i$
[/mm]
Deswegen würde ich sagen:
[mm] $V_i=1$, [/mm] wenn die Variable zu [mm] $X_{m+1},...,X_n$ [/mm] gehört
[mm] $V_i=0$, [/mm] wenn die Variable zu [mm] $X_1,...,X_m$ [/mm] gehört.
dennoch kommt man doch auf einen ganz anderen Wert für W, wenn man die 0 und die 1 genau andersherum zuweist.
Was ist denn nun richtig?!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 19:20 Fr 08.06.2012 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:49 Do 07.06.2012 | Autor: | dennis2 |
Hat wirklich niemand einen Hinweis für mich?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:20 Fr 08.06.2012 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|