Korrelation < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 08:05 Mi 04.08.2004 | Autor: | tom |
Ich habe diese Frage in keinem weiteren Forum gestellt
Hallo zusammen,
ich arbeite an einer Projektarbeit, in der ein Teil mit den Auswerten von Statistiken handelt. Ich untersuche die Entwicklung des Teilewachstums.
Zum Problem: ich habe eine Spalte, in der ich die Entwicklung des Volumens der Teile dargestellt habe. Bei dieser ist auch ein schöner Trend zu beobachten. Nun habe ich in einer zweiten Tabelle die Größe der Fahrzeuge darsgestellt und die Korrelation zwischen beiden Tabellen gebildet. Diese beträgt 0,9, wodurch man ja sagen kann, dass ein Zusammenhang zwischen beiden besteht. Wenn dieser Zusammenhang besteht, muss ich doch auch sagen können, wie das Voumen sich entwickelt, wenn ich die Fahrzeuggröße des nächsten Fahrzeuges habe.
Oder? Da ich Statistik im Studium nur ein Semester hatte, ist es für mich Neuland. In Büchern findet man auch nichts zur Auswertung von Korrelation (nur das bei 1 ein Zusammenhang besteht)
Kann mir da jemand bitte helfen!!!
MfG Tom
|
|
|
|
Hallo!
> ich arbeite an einer Projektarbeit, in der ein Teil mit den
> Auswerten von Statistiken handelt. Ich untersuche die
> Entwicklung des Teilewachstums.
Was sind das für Teile? In der Autoindustrie?
> Zum Problem: ich habe eine Spalte, in der ich die
> Entwicklung des Volumens der Teile dargestellt habe. Bei
> dieser ist auch ein schöner Trend zu beobachten. Nun habe
> ich in einer zweiten Tabelle die Größe der Fahrzeuge
> darsgestellt und die Korrelation zwischen beiden Tabellen
> gebildet. Diese beträgt 0,9, wodurch man ja sagen kann,
> dass ein Zusammenhang zwischen beiden besteht.
Ja, zumindest ein linearer Zusammenhang.
> Wenn dieser
> Zusammenhang besteht, muss ich doch auch sagen können, wie
> das Voumen sich entwickelt, wenn ich die Fahrzeuggröße des
> nächsten Fahrzeuges habe.
> Oder? Da ich Statistik im Studium nur ein Semester hatte,
> ist es für mich Neuland. In Büchern findet man auch nichts
> zur Auswertung von Korrelation (nur das bei 1 ein
> Zusammenhang besteht)
Wenn Du davon ausgehst, dass das Volumen [mm] $V_i$ [/mm] ($i$-ter von insgesamt $n$ Messwerten) linear abhängt von der Fahrzeuggröße [mm] $G_i$, [/mm] dann machst Du den Ansatz einer linearen Regression:
[mm] V_i = a + b\cdot G_i +\epsilon_i, i=1,\ldots,n[/mm]
[mm] $\epsilon_i$ [/mm] ist dabei der Messfehler (eine meist normalverteile Zufallsvariable mit Erwartungwert 0 und Varianz [mm] $\sigma^2$). [/mm] Mit Deinen Daten kannst Du nun die Koeffizienten $a$ und $b$ schätzen. Wie das genau geht, steht in jedem vernünftigen Statistikbuch. Das Stichwort habe ich Dir ja gegeben.
Was mich noch etwas irritiert an Deiner Problemschilderung, ist die Sache mit der Entwicklung. Geht es da um die Zeit? Dann könntest Du auch (mehrdimensionale) Zeitreihenanalyse betreiben. Aber da kenne ich mich nicht so gut aus, um Dir raten zu können, welches Stichwort Dir da weiter hilft. Vielleicht kann jemand anderes dazu noch etwas Schlaues sagen.
Viele Grüße
Brigitte
>
> Kann mir da jemand bitte helfen!!!
>
> MfG Tom
>
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 10:59 Mi 04.08.2004 | Autor: | tom |
Hi Birgitte,
ich danke Dir erstmal für Deine Hilfe und versuche nun damit brauchbare Ergebnisse zu erzielen.
Bei der Projektarbeit geht es darum, dazustellen wie sich die Teile in den Fahrzeugen entwickelt haben über die Jahre und heraus zu finden, welche Treiber dafür verantwortlich waren (ist halt ein Maschinenbauthema).
Nun soll ich untersuchen, ob es einen Zusammenhang zwischen dem Wachstum und den Treiber gibt. Bei meiner Literaturrecherche habe ich herausbekommen, dass man eine Zusammenhang mit der Korrelation darstellen kann. Auf grund des wegen habe ich diese gewählt.
Mit der Korrelation möchte ich nun zu nächst nur darstellen, dass es einen Zusammenhang gibt und dann will ich einen Faktor bestimmen, mit den man Aussagen für die Zukunft machen kann (unter der Voraussetzung es geht so weiter).
Ich habe auch schon versucht eine Kennzahl in den Büchern herauszufinden, mit den man eine Wichtung für die Zukunft machen kann. D.h. das halt mehrere Faktoren für das Wachstum verantwortlich sind und diese mit berücksichtigt werden sollen.
Vielleicht kannst du mir da noch eine Tipp geben.
Viele Grüße
Tom
|
|
|
|
|
Hallo Tom!
> Nun soll ich untersuchen, ob es einen Zusammenhang zwischen
> dem Wachstum und den Treiber gibt. Bei meiner
> Literaturrecherche habe ich herausbekommen, dass man eine
> Zusammenhang mit der Korrelation darstellen kann. Auf grund
> des wegen habe ich diese gewählt.
Ist ja auch richtig. Der Korrelationskoeffizient (nach Pearson) sagt aber zunächst nur etwas über einen linearen Zusammenhang aus. Andere funktionale Zusammenhänge werden damit nicht gemessen. Ein Koeffizient von 0.9 (wie bei Dir) deutet aber auf einen linearen Zusammenhang hin. Deshalb brauchst Du hier keine komplizierteren Ansätze.
> Mit der Korrelation möchte ich nun zu nächst nur
> darstellen, dass es einen Zusammenhang gibt und dann will
> ich einen Faktor bestimmen, mit den man Aussagen für die
> Zukunft machen kann (unter der Voraussetzung es geht so
> weiter).
Genau, das macht ja die lineare Regression. Hast Du einen neuen Wert [mm] $G_{n+1}$, [/mm] bestimmst Du mit den konstanten Koeffizienten $a$ und $b$ über
[mm] V_{n+1} = a + bG_{n+1}[/mm]
einen Prognosewert für [mm] $V_{n+1}$. [/mm] Du kannst auch ein Prognoseintervall angeben (auf einem vorher festgelegten Kofidenzniveau).
> Ich habe auch schon versucht eine Kennzahl in den Büchern
> herauszufinden, mit den man eine Wichtung für die Zukunft
> machen kann. D.h. das halt mehrere Faktoren für das
> Wachstum verantwortlich sind und diese mit berücksichtigt
> werden sollen.
Das ist dann multiple Regression, d.h. Du möchtest das Wachstum in Abhängigkeit mehrerer Treiber angeben. Ist das Volumen $V$ dann immer noch die Größe, die Du vorhersagen möchtest? Dann machst Du den Ansatz
[mm] V_i = a0 + a1\cdot X1_i + \ldots + an\cdot Xn_i[/mm]
wobei $X1$ bis $Xn$ die erklärenden Faktoren sind. Auch hierfür gibt es Formeln, mit denen Du die Koeffizienten $a0$ bis $an$ bestimmen kannst. Als Literatur kann ich Bücher von Sachs oder Hartung zur Angewandten Statistik bzw. konkret zur Multivariaten Statistik empfehlen. Vielleicht findest Du da was.
Viele Grüße
Brigitte
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:20 Mi 04.08.2004 | Autor: | tom |
HI Brigitte,
ich danke Dir nochmals für Deine Ausführungen.
Jedoch ergeben sich für mich immer noch ein paar Fragen.
Und zwar habe ich mich zu nächst der linearen Regression gewidmet (mit Hilfe des Buches "Zeitreihenanalyse" von Schlittgen).
Der hat dies recht übersichtlich beschrieben. Beim Berechnen der Koeffizienten a und b ergibt sich jedoch bei mir eine negative Steigung. b ist negativ.
Als X-Achse habe ich die Größe der Fahrzeuge genommen und als y-Achse die Teilevolumen.
Das müßte doch eigenlich so funktionieren. Oder?
Zu der multiplen Regression habe ich mir das Buch - Statistik von Hartung zu Hilfe genommen. Das kommt dann später dran.
Grüße Tom
|
|
|
|
|
Hallo Tom!
> ich danke Dir nochmals für Deine Ausführungen.
> Jedoch ergeben sich für mich immer noch ein paar Fragen.
> Und zwar habe ich mich zu nächst der linearen Regression
> gewidmet (mit Hilfe des Buches "Zeitreihenanalyse" von
> Schlittgen).
Das kenne ich nicht. Aber es wird schon stimmen. Isst ja Standardthema - da kann man nicht so viel falsch machen
> Der hat dies recht übersichtlich beschrieben. Beim
> Berechnen der Koeffizienten a und b ergibt sich jedoch bei
> mir eine negative Steigung. b ist negativ.
Das ist komisch. Du hattest doch von einem positiven Korrelationskoeffizienten gesprochen, +0.9. Da kannst Du unmöglich auf eine negative Steigung kommen. Wie rechnest Du denn? Übrigens kann z.B. Excel Dir die Parameter auch direkt ausrechnen - einfach ein wenig in der Hilfe suchen...
> Als X-Achse habe ich die Größe der Fahrzeuge genommen und
> als y-Achse die Teilevolumen.
Ja, das macht Sinn.
> Zu der multiplen Regression habe ich mir das Buch -
> Statistik von Hartung zu Hilfe genommen. Das kommt dann
> später dran.
Gut.
Viele Grüße
Brigitte
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:49 Mi 04.08.2004 | Autor: | tom |
Hi,
ich habe versucht die Formeln rein zu bringen, jedoch wird es zu aufwendig. Nur bei einer Formel habe ich mal eine Frage:
Im Buch steht: Werden die Jahre von [mm] t_1 [/mm] bis 25 durchnummeriert, so erhält man daraus: t=1/N * N(N+1)/2 = 13
=1/25 * 25(25+1)/2 =13 (im Buch wurde für die x-Achse Jahre genommen)
Ich hab nun für die x-Achse Werte von 1 bis 10 (ich hab 10 Wagengrößen auf der x-Achse gegeben). Ist das so richtig.
Und eine zweite Frage habe ich noch: bis zu welchen Korrelationswert kann ich die lineare Regression nehmen. Ich weiß das bei einem Korrelationswert von 0 sie nicht miteinander zu tun haben, jedoch wie sie es bei 0,7 oder 0,78 aus. Geht es dann auch noch, oder ab wann wird es komplizierter?
Grüße Tom
|
|
|
|
|
Hallo!
> Im Buch steht: Werden die Jahre von [mm]t_1[/mm] bis 25
> durchnummeriert, so erhält man daraus: t=1/N * N(N+1)/2 =
> 13
> =1/25 * 25(25+1)/2 =13
> (im Buch wurde für die x-Achse Jahre genommen)
Der Unterschied ist, dass hier ja die Zeit als erklärende Variable genommen wird (macht ja auch Sinn in einem Zeitreihenbuch)
> Ich hab nun für die x-Achse Werte von 1 bis 10 (ich hab 10
> Wagengrößen auf der x-Achse gegeben). Ist das so richtig.
Nein, das ist nicht richtig. Du möchtest doch eigentlich die Zeit vernachlässigen und zu der Wagengröße einen Zusammenhang herstellen. Jedenfalls hatte ich Dich so verstanden. Und dazu hast Du ja auch die Korrelation berechnet. Als $x$-Werte hast Du also die 10 Wagengrößen und nicht die Werte von 1 bis 10.
> Und eine zweite Frage habe ich noch: bis zu welchen
> Korrelationswert kann ich die lineare Regression nehmen.
> Ich weiß das bei einem Korrelationswert von 0 sie nicht
> miteinander zu tun haben, jedoch wie sie es bei 0,7 oder
> 0,78 aus. Geht es dann auch noch, oder ab wann wird es
> komplizierter?
Na ja, das kannst Du nach eigenem Ermessen machen. Eine Korrelation (betragsmäßig) unter 0.8 finde ich persönlich nicht ausreichend für einen Zusammenhang, aber da gibt es verschiedene Ansichten. Eine Gerade durch die Punktewolke kannst Du immer legen, kann Dir ja keiner verbieten. Aber statistische Aussagen (z.B. Prognoseintervalle) werden bei einer geringen Korrelation ungenauer (bis hin zu wirkungslos).
Viele Grüße
Brigitte
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:36 Mi 04.08.2004 | Autor: | tom |
Hi Brigitte,
mein Gott jetzt hat er's. Vor lauter Formeln und Zahlen war ich schon total blind. Habe mir ein kleines Beispiel zurechtgebastetl gehabt und anhand dieses rumprobiert.
Im Buch vom Hartung steht auch ein einfacherer Weg drin, mit dem ich nun zum Ziel kam.
Nun ist die multi Regression noch dran.
Ich danke Dir für Deine Ratschläge. Einen schönen sonnigen Tag noch.
Grüße
Tom
|
|
|
|