Das doppelte Probenahme ist eine Technik, die in der Inferenzstatistik verwendet wird, wenn Sie mehr Details und Sicherheit über eine bestimmte Variable erfahren möchten, die eine bestimmte Population charakterisiert.
Die zweite Bevölkerungsstichprobe wird im Allgemeinen durchgeführt, nachdem eine erste Stichprobe entnommen und analysiert wurde, deren Analyse zu keiner der Studienvariablen eine statistisch signifikante Schlussfolgerung ergab..
Aus diesem Grund wird die Doppelstichprobe in der Statistik auch als bezeichnet zweistufige Probenahme. Der Nutzen der zweiten Stichprobe besteht darin, dass sie dazu beiträgt, die Schätzung von Verhältnissen und Regressionen einer bestimmten Hilfsvariablen, die sich im Lichte der Analyse einer ersten Stichprobe ergibt, genauer zu bestimmen..
Eine andere Verwendung, die der Doppelstichprobe gegeben wird, besteht darin, Informationen zu sammeln, um eine Abtastung durch Schichten durchzuführen..
Verschiedene Situationen, in denen eine doppelte Probenahme gerechtfertigt ist, werden nachstehend beschrieben..
Die Doppelstichprobenmethode wird häufig in der industriellen Qualitätskontrolle verwendet und erfolgt normalerweise in zwei Phasen..
Angenommen, eine Industriemaschine stellt bestimmte Teile her. Unabhängig davon, wie stark die Maschine eingestellt ist, ist kein Teil mit dem anderen identisch, da kleine Abweichungen in den Abmessungen und im Gewicht auftreten können. Es geht darum festzustellen, ob eine von dieser Maschine hergestellte Charge von Teilen die Toleranzkriterien für die Annahme oder Ablehnung erfüllt..
Zunächst wird eine zufällige Stichprobe von Teilen entnommen, mit der Sie überprüfen möchten, ob eine der Variablen, z. B. die Länge des Teils, innerhalb der Toleranz liegt.
Für den Fall, dass die durchschnittliche Länge unter oder über dem für diese Variable gewünschten Toleranzgrad liegt, wird in dieser ersten Probe gefolgert, dass die Charge fehlerhaft ist und verworfen werden muss. In diesem Fall sind keine neuen Muster erforderlich.
Wenn umgekehrt der Durchschnittswert innerhalb des Toleranzbereichs liegt, die Standardabweichung der Stichprobe jedoch groß genug ist, dass die Addition oder Subtraktion des Durchschnittswerts außerhalb des Bereichs liegt, muss eine zweite, größere Stichprobe entnommen werden..
Diese zweite Stichprobe muss die Originalstichprobe enthalten, um die Berechnungen zu wiederholen und somit eine endgültige Entscheidung bezüglich der untersuchten Variablen treffen zu können. Auf diese Weise kann festgestellt werden, ob die Charge defekt ist oder nicht.
In vielen Fällen ist der Zugriff auf die Informationen zu einer der zu untersuchenden Variablen schwierig. Möglicherweise gibt es jedoch eine Hilfsvariable, die für die Datenerfassung einfacher ist.
In diesem Fall werden zwei Proben genommen, eine große für die Hilfsvariable, die weniger teuer ist, und eine kleinere Probe, die in der größeren Probe der teuersten Variablen enthalten ist..
Diese Methode ist immer dann anwendbar, wenn festgestellt wird, dass zwischen beiden Variablen eine Korrelation besteht, was im Allgemeinen eine proportionale Beziehung ist..
Ein Beispiel für diese Situation findet sich in den Forstwissenschaften, wo der Prozentsatz der von einer parasitären Pflanze (Ringwurm) betroffenen Bäume bestimmt werden soll..
Da es sich um sehr ausgedehnte und schwer zugängliche Regionen handelt, ist die Untersuchung der gesamten Baumpopulation zeitlich und kostenmäßig nicht durchführbar. Diese Schritte werden dann ausgeführt:
Eine vorläufige Stichprobe würde aus der Verwendung von Luftbildern bestehen, und der Wald ist in Grundstücke unterteilt. Von hier aus werden einige Lose zufällig ausgewählt und durch Analyse der Bilder der ausgewählten Lose wird geschätzt, wie viele Bäume vom Ringwurm betroffen sind, da die Farbe der Bäume vom Parasiten beeinflusst wird..
Die fotografische Analyse kann jedoch ungenau sein, so dass einige Chargen der ersten Probe, vorzugsweise zufällig, ausgewählt werden, um Feldarbeiten durchzuführen..
Das Feldergebnis wird dann mit dem fotografischen zum Abfangen der beiden Chargensätze verglichen. Dieser Vergleich kann zum Beispiel durchgeführt werden, indem ein Diagramm erstellt wird, in dem die horizontale Achse der Wert ist, der für jede Charge durch Fotografie erhalten wird, und auf der vertikalen Achse der Wert, der pro Charge durch Feldarbeit erhalten wird..
Diese grafische Methode ermöglicht es, visuell zu identifizieren, ob eine Korrelation zwischen beiden Ergebnissen besteht oder nicht, und durch eine Regressionsanalyse den Proportionalitätskoeffizienten oder das Verhältnis zwischen beiden Proben zu bestimmen..
Nach der größten Probe, dh der fotografischen Probe, werden der Durchschnittswert infizierter Bäume und ihre Standardabweichung genommen. Da jedoch der Proportionalitätskoeffizient und sein Fehler mit den Feldproben bestimmt wurden, ist es möglich, das Ergebnis der größeren Probe (der fotografischen) zu korrigieren..
Dieses Ergebnis kann dann auf die gesamte Baumpopulation hochgerechnet werden.
In den beschriebenen Beispielen ist der Kostenvorteil offensichtlich, da das Ersetzen einer leicht zugänglichen Variablen durch eine schwer zugängliche Variable Zeit und Geld spart..
Ein Nachteil ist, dass bei Doppelproben zur Qualitätskontrolle die Gefahr besteht, dass gute Chargen von Produkten durchlaufen werden, die außerhalb der Toleranz liegen..
Wir wollen die Anzahl der kranken Bäume in einem 162 Hektar großen Wald schätzen. Da der Wald sehr ausgedehnt ist, ist er in 100 Parzellen derselben Fläche unterteilt. 18 Parzellen werden zufällig ausgewählt und anhand einer fotografischen Studie wird geschätzt, dass es in diesen 18 Parzellen 8,5 erkrankte Bäume mit einem Standardfehler von plus oder minus 4,5 Bäumen gibt.
Aus diesen 18 Parzellen werden 8 Parzellen zufällig ausgewählt, in denen die Feldstudie durchgeführt wird. Für diese acht Parzellen zeigt die fotografische Studie 10 kranke Bäume mit einem Fehler von plus oder minus 5,3 Bäumen..
Andererseits zeigt die Feldstudie für dieselben acht Parzellen 12,4 kranke Bäume mit einem Fehler von plus minus 6,3 Bäumen.
Es fragt:
Es wird ein Diagramm der Anzahl der Bäume pro fotografischer Zählung gegenüber der Feldanzahl für die acht für beide Studien ausgewählten Lose erstellt..
Eine Trendlinie wird angepasst und ihre Steigung bestimmt. In diesem Fall wird erhalten, dass der Proportionalitätskoeffizient 1,23 beträgt. Das heißt, wenn X die Zahl pro fotografischer Zählung ist, wird geschätzt, dass die Feldzahl Y = 1,23 X ist.
Die Anzahl der erkrankten Bäume gemäß der fotografischen Anzahl in den 18 ausgewählten Losen beträgt:
18 x 8,5 = 153
Da jedoch der gesamte Wald in 100 Parzellen desselben Gebiets aufgeteilt wurde, beträgt die Anzahl der nach der fotografischen Methode geschätzten kranken Bäume: (100/18) x 153 = 850.
Der Korrekturfaktor, der sich aus dem Vergleich zwischen Feld- und Fotostudie ergibt, wird nun angewendet:
Geschätzte tatsächliche Anzahl kranker Bäume im Wald = 1,23 x 850 = 1046.
Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.