GoF Tests in R < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo Leute,
ich benötige ein paar Tipps.
Ich muss einen Datensatz von ca 7000 Einzeldaten auf Verteilungszugehörigkeit prüfen.
Bisher habe ich die verschiedenen Prüfvertelungen gefittet, und einen KS-Test, Chi-Square-Test und Anderson Darling Test durchgeführt.....!
Jetzt wollte ich mal in die Runde fragen ob mir jmd. noch eien Tipp geben könnte welche GoF-Tests ich noch durchführen könnte.
Wenn es möglich wäre mit einem Hinweis wie man diese in R umsetzt.
Vielen Dank im Vorraus.
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:11 Do 28.04.2011 | Autor: | luis52 |
> Hallo Leute,
> ich benötige ein paar Tipps.
Moin,
>
> Ich muss einen Datensatz von ca 7000 Einzeldaten auf
> Verteilungszugehörigkeit prüfen.
Was sind das fuer Daten und auf welche Verteilung wird getestet?
> Bisher habe ich die verschiedenen Prüfvertelungen
> gefittet, und einen KS-Test, Chi-Square-Test und Anderson
> Darling Test durchgeführt.....!
Wozu? Bist du unzufrieden mit dem Ergebnis? Chi-Quadrattest hat i.a.
wenig Power, der KS-Test ist hakelig, wenn Parameter geschaetzt werden ...
> Jetzt wollte ich mal in die Runde fragen ob mir jmd. noch
> eien Tipp geben könnte welche GoF-Tests ich noch
> durchführen könnte.
Mal sehen, was du uns mitteilst.
vg Luis
|
|
|
|
|
Vielen Dank für die schnelle Antwort,
also ich betrachte einen Datensatz von ca 6000 Einzelwerte zwischen -0.05 und 0.05.
Jetzt möchte ich schauen welcher Verteilung dieser Dtensatz am ehesten entspricht. Ich prüfe au Normalverteilung, Exponential, Logistic, Lognormal, Studenten-t, Weibull, F und Gamma. (bisher habe ich die Werte so verschoben dass alle > 0 sind, weil einige Funktionen im negativen Bereich nicht definiert sind. Evtl. gibts hierzu auch ne alternative, dass man die verteilung irgendwie shifted....)
Ja unzufrieden bin ich nicht zwingend mit den Ergebnissen, aber ich wollte eine alternative zu dem KS und Chi-square -Test haben.
Und gerade ist mir aufgefallen dass der KS -Test bei größeren Datenmengen rumzickt.....!
falls es hilft mein quellcode schaut in etwa so aus....
library(fitdistrplus)
a5 <- fitdist(Xshift, dnorm)$estimate
a6 <- fitdist(Xshift, dexp)$estimate
a7 <- fitdist(Xshift, dlogis)$estimate
a8 <- fitdist(Xshift, dlnorm)$estimate
usw...
ks.test.norm <- ks.test(Xshift,"pnorm", mean=a5[1][ [1]], sd=a5[2][ [1]])
ks.test.exp <- ks.test(Xshift,"pexp", rate=a6[1][ [1]])
ks.test.logis <- ks.test(Xshift,"plogis", location=a7[1][ [1]], scale=a7[2][ [1]])
ks.test.lnorm <- ks.test(Xshift,"plnorm", meanlog=a8[1][ [1]], sdlog=a8[2][ [1]])
usw...
Weiters Problem ist, dass ich in R relativer Anfänger bin.....!
MFG
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 17:03 Do 28.04.2011 | Autor: | luis52 |
Bei deinem grossen Stichprobenumfang duerften der KS- und der AD-Test zu aehnliche Ergebnisse liefern. Allerdings ist die Berechnung der p-Werte kritisch.
Warum begnuegst du dich nicht mit PP- oder QQ-Plots, was ebenfalls interessante Einblicke geben kann. Literatur:
@book{d1986goodness,
title={{Goodness-of-fit techniques}},
author={D'Agostino, R.B. and Stephens, M.A.},
isbn={0824774876},
year={1986},
publisher={CRC}
}
vg Luis
|
|
|
|