Datenerzeugung für Regression < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 12:55 Fr 20.01.2006 | Autor: | klaudia |
Hallo,
ich habe vor verschiedene Methoden der linearen Regression (least squares, orthogonale Regression und andere) in Bezug auf ihre Annäherung an die wahre Ebene zu vergleichen. Dafür brauche ich künstlich erzeugte Punkte aus dem [mm] \IR^3, [/mm] die fast (bis auf einen kleinen Fehler) auf einer Ebene der Form a [mm] x_{1} [/mm] + b [mm] x_{2} [/mm] +c [mm] x_{3} [/mm] = d liegen sollen. Ich weiß allerdings nicht wie ich möglichst realitätsnahe Punkte (inklusive Messfehlern in allen Koordinaten) erhalte. Eine Idee wäre a,b,c und d erst fest zu wählen, dann anschliessend [mm] x_{1} [/mm] und [mm] x_{2} [/mm] zufällig rechteckverteilt zwischen 0 und 100 zu bestimmen und dann [mm] x_{3} [/mm] so zu berechnen, so dass der Punkt x exakt auf der Ebene liegt. Zum Schluß würde ich dann noch einen N(0,1)-verteilten Fehler in jeder Komponente addieren.
Meine Frage ist, ob man dadurch Punkte erhält, die auch tatsächlich hätten gemessen werden können. Bzw. welche Verteilungen sollte ich wählen, wenn ich zwischen einer linearen Regression auf z.B. physikalischen und wirtschaftlichem Gebiet unterscheiden möchte?
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt
|
|
|
|
Hi!
Also bei uns in den Wirtschaftswissenschaften werden typischerweise normalverteilte Residuen angenommen (nicht unbedingt standardnormalverteilt). Wie's bei physikalischen Größen ist, weiß ich nicht, da aber zur Inferenz bei KQ-Schätzern F-Verteilung erforderlich ist, denke ich mal, daß das kaum anders geht, als mit normalverteilter Störgröße.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:41 Sa 21.01.2006 | Autor: | klaudia |
Okay, die Residuen sollen normalverteilt sein. Aber was ist mit den Verteilungen der eigentlichen Datenpunkte. Und wie groß darf die Störgröße sein im Verhältnis zu dem Wert ohne Fehler? Kann ich also beliebig N(0,1) bis N(0,100) verteilte Residuen betrachten, egal welcher Verteilung die Datenpunkte selbst unterliegen?
|
|
|
|
|
Also mit "verteilten", d.h. stochastischen Regressoren wäre ich ganz vorsichtig. Im allgemeinen dürfte aber das Fitting der Regression sich nicht an der absoluten Größe der Residuen messen lassen, dazu gibt's ja standardisierte Gütemaße wie das (korrigierte) Bestimmtheitsmaß.
|
|
|
|