Stichprobengrösse < Wahrscheinlichkeitstheorie < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 19:13 So 30.09.2012 | Autor: | tgl |
Aufgabe | Hallo Matheinterssierte
ich habe in meinem beruflichen Umfeld die Aufgabe, den Zustand von elektrischen Anlagen zu überprüfen. Probelm ist das Mengengerüst - nämlich ist die Grundgesamtheit 16.500 Einheiten gross, die ich ummöglich alle prüfen will. Daher will ich über die Wahrscheinlichkeitsrechnung die Prüfung begrenzen. Problem: wie gross muss die Stichprobe sein. Konkrete Frage:
Wie gross muss die Stichprobe sein, damit ich mit x% Wahrscheinlichkeit y% aller Fehler finde?
Besten Dank
Thorsten |
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hallo Thorsten und
Ich möchte mal meine Antwort in zwei Teile Gliedern. Der erste Teil wäre die einfache Rückfrage, über welchen Kenntnisstand in Sachen beutreilende Statistik du verfügst.
Der zweite Teil wäre meine Feststellung, dass die Fragestellung m.A. nach so keinen Sinn ergibt.
Sinngemäß möchtest du, anhand einer bestimmten Fehlerzahl in einer untersuchten Stichprobe vom Umfang n angeben können, dass sich die tatsächliche Fehlerzahl mit einer sog. Vertrauenswahrscheinlichkeit (die üblicherweise mit 95% oder 99% gewählt wird) in einem bestimmten Intervall befindet.
Dazu muss man einen Hypothesentest vornehmen. Man muss dabei nicht unbedingt die Art der Verteilung der Grundgesamtheit kennen, hilfreich ist es aber. Deine Problembeschreibung legt eine Binomialverteilung nahe. Hat jede Anlage für sich die gleiche Wahrscheinlichkeit, einen Fehler aufzuweisen?
Gruß, Diophant
|
|
|
|
|
> Hallo Matheinterssierte
>
> ich habe in meinem beruflichen Umfeld die Aufgabe, den
> Zustand von elektrischen Anlagen zu überprüfen. Probelm
> ist das Mengengerüst - nämlich ist die Grundgesamtheit
> 16.500 Einheiten gross, die ich ummöglich alle prüfen
> will. Daher will ich über die Wahrscheinlichkeitsrechnung
> die Prüfung begrenzen. Problem: wie gross muss die
> Stichprobe sein. Konkrete Frage:
> Wie gross muss die Stichprobe sein, damit ich mit x%
> Wahrscheinlichkeit y% aller Fehler finde?
>
> Besten Dank
>
> Thorsten
Hallo Thorsten,
Diophant hat schon geantwortet und versucht, dir die
üblichen Vorgehensweisen in der Statistik nahezulegen.
Dies ist wohl auch zu empfehlen.
Wenn man jedoch deine Fragestellung so nimmt, wie
du sie formuliert hast, müsste man sie wohl etwa so
modellieren:
Wir nehmen an, dass N Objekte vorliegen, von
welchen [mm] F=p_F*N [/mm] Stück fehlerhaft und N-F Stück fehlerfrei
sind (in praktischen Situationen ist es allerdings oft
nicht ganz so einfach - ob die einfachen Annahmen
in deinem Fall zutreffen, musst du selber entscheiden).
Die Wahrscheinlichkeit p ist im Vornherein nicht bekannt.
Vermutlich hat man aber im konkreten Fall doch ge-
wisse Vorkenntnisse, z.B. dass [mm] p_F [/mm] höchstens 0.1 (also 10%)
beträgt.
Gehen wir einmal zunächst von einer konkret gegebenen
Fehlerwahrscheinlichkeit [mm] p_F [/mm] aus.
Du gibst zwei weitere Werte vor. Zu ihrer Bezeichnung
will ich nicht x und y und auch nicht Prozentwerte
benützen, sondern:
Wir suchen die (minimale) Stichprobengröße S mit der
Eigenschaft, dass mit einer Wahrscheinlichkeit von
(mindestens) p mindestens q*F fehlerhafte Stücke in
die Stichprobe fallen.
Um ein ganz konkretes Beispiel zu erhalten, setze ich
einmal:
N=10000
[mm] p_F=0.1
[/mm]
p=0.95
q=0.9
Wir haben also quasi eine Urne mit 10000 Kugeln,
wovon etwa 1000 schwarze (fehlerhafte), der Rest weiß.
S soll nun so groß gewählt werden, dass mit einer
Wahrscheinlichkeit von 95% mindestens 900 der
schwarzen Kugeln in die (aus S Kugeln bestehende)
Stichprobe fallen.
Falls du mit dieser Modellierung einverstanden bist,
können wir an die entsprechenden Berechnungen
gehen.
Ich befürchte allerdings, dass dir das Ergebnis mögli-
cherweise nicht sehr gefallen wird. Die notwendige
Stichprobenanzahl S könnte doch deutlich größer
ausfallen als du es dir erhoffst ...
LG Al-Chwarizmi
|
|
|
|
|
> Wenn man jedoch deine Fragestellung so nimmt, wie
> du sie formuliert hast, müsste man sie wohl etwa so
> modellieren:
>
> Wir nehmen an, dass N Objekte vorliegen, von
> welchen [mm]F=p_F*N[/mm] Stück fehlerhaft und N-F Stück
> fehlerfrei
> sind (in praktischen Situationen ist es allerdings oft
> nicht ganz so einfach - ob die einfachen Annahmen
> in deinem Fall zutreffen, musst du selber entscheiden).
> Die Wahrscheinlichkeit p ist im Vornherein nicht bekannt.
> Vermutlich hat man aber im konkreten Fall doch ge-
> wisse Vorkenntnisse, z.B. dass [mm]p_F[/mm] höchstens 0.1 (also
> 10%)
> beträgt.
>
> Gehen wir einmal zunächst von einer konkret gegebenen
> Fehlerwahrscheinlichkeit [mm]p_F[/mm] aus.
> Du gibst zwei weitere Werte vor. Zu ihrer Bezeichnung
> will ich nicht x und y und auch nicht Prozentwerte
> benützen, sondern:
> Wir suchen die (minimale) Stichprobengröße S mit der
> Eigenschaft, dass mit einer Wahrscheinlichkeit von
> (mindestens) p mindestens q*F fehlerhafte Stücke in
> die Stichprobe fallen.
>
> Um ein ganz konkretes Beispiel zu erhalten, setze ich
> einmal:
>
> N=10000
> [mm]p_F=0.1[/mm]
> p=0.95
> q=0.9
>
> Wir haben also quasi eine Urne mit 10000 Kugeln,
> wovon etwa 1000 schwarze (fehlerhafte), der Rest weiß.
> S soll nun so groß gewählt werden, dass mit einer
> Wahrscheinlichkeit von 95% mindestens 900 der
> schwarzen Kugeln in die (aus S Kugeln bestehende)
> Stichprobe fallen.
>
> Falls du mit dieser Modellierung einverstanden bist,
> können wir an die entsprechenden Berechnungen
> gehen.
>
> Ich befürchte allerdings, dass dir das Ergebnis mögli-
> cherweise nicht sehr gefallen wird. Die notwendige
> Stichprobenanzahl S könnte doch deutlich größer
> ausfallen als du es dir erhoffst ...
>
> LG Al-Chwarizmi
Ich habe jetzt die Rechnung zum gewählten Beispiel
durchgeführt und bin zu folgendem Ergebnis gelangt:
Um mit wenigstens 95% Wahrscheinlichkeit mindestens
900 der 1000 fehlerhaften unter den insgesamt 10000
Stücken zu finden, muss man von den 10000 Stück
wenigstens 9136 Stück überprüfen !
Gegenüber einer Gesamtuntersuchung aller produzierten
Stücke spart man also nicht einmal 10% des Aufwandes.
Um zu einer wesentlichen Einsparung beim Prüfaufwand
zu kommen, müsstest du also die Kriterien stark
abschwächen.
LG, Al-Chwarizmi
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:32 Mo 01.10.2012 | Autor: | tgl |
Aufgabe | ... diesen Text hier... |
Hallo Forumsmitglieder
vorb erst einmal besten Dank an Al-Chwarizmi - leider ist die Antwort im Ergebnis unbefriedigend, da die Stichprobe fast die Grundgesamtheit umfasst.
Aber: heute habe ich meine eigene Stichprobe ausgewertet. Folgender Sachverhalt: die Grundgesamtheit von 16.500 kann ich guten Gewissens in drei Cluster aufteilen:
Cluster 1: ca. 4000 Einheiten, Stichprobe 200, Fehlerquote 10% bezogen auf 200
Cluster 2: ca. 5000 Einheiten, Stichprobe 150, Fehlerquote 4% bezogen auf 150
Cluster 3: ca. 7500 Einheiten, Stichprobe 150, Fehlerquote 2% bezogen auf 150
Also am Beispiel Cluster 3: ich gehe also davon aus, dass bezogen auf die 7.500 Einheiten 2%, d.h. 150 Stück fehlerbehaftet sind. Ist also die richtige Frage etwa wie folgt:
"Wie gross muss die Stichprobe S ein, damit ich mit einer Wahrscheinlicheit von 90% die fehlerbehafteten Stücke (hier 150) finde?"
Nochmals besten Dank für Eure Hilfe
Gruss
Thorsten
|
|
|
|
|
Hallo Thorsten,
ich habe den Eindruck, Du willst etwas Unmögliches.
> "Wie gross muss die Stichprobe S ein, damit ich mit einer
> Wahrscheinlicheit von 90% die fehlerbehafteten Stücke
> (hier 150) finde?"
Man macht Stichproben, um eine hinreichend wahrscheinliche Aussage über die Gesamtmenge zu treffen. Wenn Du also 150 von 7500 Stück prüfst und dabei 2% fehlerhafte Stücke findest (also 3), dann kann man die Qualität der Ausweitung auf die Grundgesamtheit bewerten.
Was man aber nicht kann, ist mit einer Stichprobe dann zuverlässig 90% der fehlerhaften Stücke zu finden. Dazu musst Du in der Tat deutlich über 90% der Grundgesamtheit prüfen.
Mach es Dir an einem Beispiel klar: wenn 37% CDU/CSU wählen, 27% SPD, 13% die Grünen, 8% die Linke, 6% die Piraten, 5% die FDP und 4% sonstige Parteien (so die aktuelle Antwort auf die Sonntagsfrage), wieviele Bundesbürgerinnen und -bürger musst Du dann befragen, um 90% der FDP-Wähler namentlich benennen zu können?
Wie gesagt, mir scheint, Du willst etwas Unmögliches.
Was Du eigentlich brauchst, ist ein optimierter Suchalgorithmus für die fehlerhaften Stücke. Den wird es aber nicht geben, wenn diese zufallsverteilt sind, sondern nur, wenn z.B. trotz nur weniger fehlerhafter Stücke die Wahrscheinlichkeit, dass das benachbarte Stück auch fehlerhaft ist, signifikant gegenüber der Zufallsverteilung erhöht ist.
Grüße
reverend
|
|
|
|