Ähnlichkeit von Daten < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo.
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
Ich habe mich schon eine Weile nicht mehr intensiv Statistik beschäftigt, und brauche deshalb eine Idee, die mich in die richtige Richtung weist:
Ich habe mehrere Datensätze (40), die alle mit dem gleichen Experiment unter leicht unterschiedlichen Anfangsbedingungen gewonnen wurden. Pro Datensatz handelt es sich um 100 Werte (schon normalisiert) , zum Beispiel so:
reihe A reihe B
-4,4E-05 -6,3E-05
-0,001321 0,008624
-0,008631 0,012439
-0,002508 0,020912
. ..
Wenn man diese grafisch darstellt, kann man mit dem Auge mehrere Gruppen unterscheiden (ich kann jedoch nicht vorher sagen, wieviele Gruppen es werden). Ich würde gerne ein Ähnlichkeitsmaß dieser Gruppen finden. Interessant ist vielleicht, dass normalitätstests negativ ausfallen, die Daten sind also nicht normal verteilt. Auch besteht kein zusammenhang der einzelnen datenreihen, aber sehr ähnliche reihen plotten natürlich im crossplot sehr nahe an einem linearen graphen.
Mein Ansatz war eine Clusteranalyse mit "complete linkage" (mit Mystat) und euklidischer Distanz.
Ich bin aber nicht sicher, ob das das angemessene Verfahren ist, obwohl erste Ergebnisse recht vielversprechend aussehen. Was meint ihr dazu?
grüße, ingo
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:27 Fr 15.08.2008 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|