Kurator: Cesare Magri
Ludovico Carraro
Eugene M. Izhikevich
Stefano Panzeri
Nick Orbeck
Sampling bias bedeutet, dass die Stichproben einer stochastischen Variablen, die zur Bestimmung ihrer Verteilung gesammelt werden, falsch ausgewählt werden und aus nicht zufälligen Gründen nicht die wahre Verteilung darstellen. Betrachten wir ein konkretes Beispiel: vielleicht möchten wir das Ergebnis einer Präsidentschaftswahl anhand einer Meinungsumfrage vorhersagen. Wenn Sie 1000 Wähler nach ihren Wahlabsichten fragen, können Sie eine ziemlich genaue Vorhersage des wahrscheinlichen Gewinners treffen, aber nur, wenn unsere Stichprobe von 1000 Wählern für die gesamte Wählerschaft ‚repräsentativ‘ ist (dh unvoreingenommen). Wenn wir nur die Meinung von 1000 weißen Studenten der Mittelschicht befragen, dann sind die Ansichten vieler wichtiger Teile der Wählerschaft als Ganzes (ethnische Minderheiten, ältere Menschen, Arbeiter) wahrscheinlich in der Stichprobe unterrepräsentiert, und unsere Fähigkeit, das Ergebnis der Wahl aus dieser Stichprobe vorherzusagen, ist reduziert.In einer unvoreingenommenen Stichprobe sollten Unterschiede zwischen den Stichproben einer Zufallsvariablen und ihrer wahren Verteilung oder Unterschiede zwischen den Stichproben von Einheiten aus einer Population und der gesamten Population, die sie repräsentieren, nur aus dem Zufall resultieren. Wenn ihre Unterschiede nicht nur auf Zufall zurückzuführen sind, liegt ein Sampling-Bias vor. Sampling Bias entstehen oft, weil bestimmte Werte der Variablen systematisch unter- oder überrepräsentiert sind in Bezug auf die wahre Verteilung der Variablen (wie in unserem Meinungsumfragebeispiel oben). Aufgrund seiner konsistenten Natur führt Sampling Bias zu einer systematischen Verzerrung der Schätzung der abgetasteten Wahrscheinlichkeitsverteilung. Diese Verzerrung kann nicht durch Erhöhung der Anzahl von Datenabtastwerten beseitigt werden und muss durch geeignete Techniken korrigiert werden, von denen einige im Folgenden diskutiert werden. Mit anderen Worten, die Befragung zusätzlicher 1000 weißer College-Studenten wird die Vorhersagekraft unserer Meinungsumfrage nicht verbessern, aber die Befragung von 1000 zufällig aus dem Wählerverzeichnis ausgewählten Personen würde dies tun. Offensichtlich kann eine verzerrte Stichprobe Probleme beim Maß von Wahrscheinlichkeitsfunktionalen verursachen (z., die Varianz oder die Entropie der Verteilung), da jede aus dieser Stichprobe berechnete Statistik das Potenzial hat, durchweg fehlerhaft zu sein.
- Inhaltsverzeichnis
- Ursachen für Stichprobenverzerrungen
- Korrektur und Reduzierung von Stichprobenverzerrungen
- Sampling bias, sampling error, bias of probability function, and limited sampling bias
- Der Effekt begrenzter Stichproben auf die Bestimmung statistischer und kausaler Zusammenhänge
- Sampling Bias in den Neurowissenschaften
Inhaltsverzeichnis
- 1 Ursachen von Sampling Bias
- 2 Korrektur und Reduktion von Sampling Bias
- 3 Sampling Bias, sampling error, Bias of probability function, und limited sampling bias
- 4 Der Effekt von limited Sampling auf die Bestimmung statistischer und kausaler Zusammenhänge
- 5 Sampling Bias in neuroscience
- 6 Referenzen
- 7 Externe Links
- 8 Siehe auch
Ursachen für Stichprobenverzerrungen
Eine häufige Ursache für Stichprobenverzerrungen liegt im Design der Studie oder in der Datenerhebung beide können das Sammeln von Daten von bestimmten Klassen oder Einzelpersonen oder unter bestimmten Bedingungen begünstigen oder ablehnen. Sampling Bias ist auch besonders prominent, wenn Forscher Stichprobenstrategien auf der Grundlage von Urteilsvermögen oder Bequemlichkeit anwenden, bei denen das zur Auswahl der Stichproben verwendete Kriterium irgendwie mit den interessierenden Variablen zusammenhängt. Zum Beispiel kann ein akademischer Forscher, der Meinungsdaten sammelt, aufgrund der Bequemlichkeit wählen, Meinungen hauptsächlich von College-Studenten zu sammeln, weil sie zufällig in der Nähe leben, und dies wird die Stichprobe weiter auf die Meinung ausrichten, die in der sozialen Klasse, die in der Nachbarschaft lebt, vorherrscht.
Abbildung 1: Mögliche Verzerrungsquellen bei der Auswahl einer Stichprobe aus einer Population.
In den Sozial- und Wirtschaftswissenschaften erfordert das Extrahieren von Zufallsstichproben typischerweise einen Stichprobenrahmen wie die Liste der Einheiten der gesamten Bevölkerung oder einige Zusatzinformationen zu einigen Schlüsselmerkmalen der zu beprobenden Zielpopulation. Um beispielsweise eine Studie über Grundschulen in einem bestimmten Land durchzuführen, muss eine Liste aller Schulen des Landes erstellt werden, aus der eine Stichprobe entnommen werden kann. Die Verwendung eines Abtastrahmens verhindert jedoch nicht unbedingt eine Abtastverzerrung. Zum Beispiel kann man die Zielpopulation nicht richtig bestimmen oder veraltete und unvollständige Informationen verwenden, wodurch Teile der Zielpopulation ausgeschlossen werden. Darüber hinaus kann selbst bei richtiger Auswahl des Stichprobenrahmens eine Stichprobenverzerrung durch nicht ansprechende Stichprobeneinheiten entstehen (z. B. können bestimmte Subjektklassen die Teilnahme eher ablehnen oder schwerer zu kontaktieren sein usw.) Nichtantworten verursachen besonders häufig Verzerrungen, wenn der Grund für die Nichtantwort mit dem untersuchten Phänomen zusammenhängt. Abbildung 1 veranschaulicht, wie die Diskrepanzen zwischen Stichprobenrahmen und Zielpopulation sowie die Nichtantworten die Stichprobe verzerren könnten.
In Experimenten in den physikalischen und biologischen Wissenschaften tritt ein Sampling-Bias häufig auf, wenn die während des Experiments zu messende Zielgröße (z. B. die Energie eines physikalischen Systems) mit anderen Faktoren (z. B. der Temperatur des Systems) korreliert ist, die während des Experiments fest oder in einem kontrollierten Bereich gehalten werden. Betrachten wir zum Beispiel die Bestimmung der Wahrscheinlichkeitsverteilung der Geschwindigkeit aller Autos auf britischen Straßen zu jeder Zeit während eines bestimmten Tages. Die Geschwindigkeit hängt definitiv mit dem Standort zusammen: Daher kann die Messung der Geschwindigkeit nur an bestimmten Orten die Probe verzerren. Wenn beispielsweise alle Maßnahmen an stark frequentierten Verkehrsknotenpunkten in der Innenstadt ergriffen werden, wird die stichprobenartige Verteilung der Fahrzeuggeschwindigkeiten nicht repräsentativ für die britischen Autos sein und stark auf langsame Geschwindigkeiten ausgerichtet sein, da Autos, die auf Autobahnen und anderen schnellen Straßen fahren, vernachlässigt werden. Es ist wichtig zu beachten, dass eine systematische Verzerrung einer abgetasteten Verteilung einer Zufallsvariablen auch aus anderen Faktoren als der Abtastverzerrung resultieren kann, z. B. einem systematischen Fehler in den Instrumenten, die zum Sammeln der Stichprobendaten verwendet werden. Betrachten wir noch einmal das Beispiel der Verteilung der Geschwindigkeit von Autos in Großbritannien und nehmen wir an, dass der Experimentator Zugang zum gleichzeitigen Lesen der Geschwindigkeitsmesser hat, die an jedem Auto angebracht sind, so dass es keine Abtastverzerrung gibt. Wenn die meisten Tachometer so eingestellt sind, dass sie die Geschwindigkeit überschätzen und bei höherer Geschwindigkeit stärker überschätzen, wird die resultierende abgetastete Verteilung auf hohe Geschwindigkeiten vorgespannt.
Korrektur und Reduzierung von Stichprobenverzerrungen
Um die Stichprobenverzerrung zu verringern, sind die beiden wichtigsten Schritte beim Entwurf einer Studie oder eines Experiments (i) die Vermeidung von Urteilsvermögen oder Convenience-Sampling (ii) um sicherzustellen, dass die Zielpopulation richtig definiert ist und dass der Stichprobenrahmen so weit wie möglich mit ihr übereinstimmt. Wenn begrenzte Ressourcen oder Effizienzgründe die Möglichkeit einschränken, die gesamte Population in Stichproben zu erfassen, sollte darauf geachtet werden, dass sich die ausgeschlossenen Populationen in Bezug auf die zu messenden Statistiken nicht von der Gesamtpopulation unterscheiden. In den Sozialwissenschaften sind repräsentative Bevölkerungsumfragen am häufigsten keine einfachen Zufallsstichproben, sondern folgen komplexeren Stichprobendesigns (Cochran 1977). Zum Beispiel, In einer typischen Haushaltserhebung wird eine Stichprobe von Haushalten in zwei Stufen ausgewählt: in einer ersten Stufe erfolgt eine Auswahl von Dörfern oder Stadtteilen (Cluster) und in einer zweiten Stufe wird eine festgelegte Anzahl von Haushalten innerhalb desselben Clusters ausgewählt. Bei der Übernahme solch komplexer Stichprobendesigns muss unbedingt sichergestellt werden, dass die Stichprobenrahmeninformationen ordnungsgemäß verwendet werden und dass die Wahrscheinlichkeit und die Zufallsauswahl in jeder Phase des Stichprobenprozesses implementiert und dokumentiert werden. Tatsächlich sind solche Informationen unerlässlich, um unvoreingenommene Schätzungen für die Grundgesamtheit unter Verwendung von Stichprobengewichten (der Umkehrung der Auswahlwahrscheinlichkeit) und unter Berücksichtigung des Stichprobenentwurfs zu berechnen, um den Stichprobenfehler ordnungsgemäß zu berechnen. Bei komplexen Stichprobenentwürfen ist der Stichprobenfehler immer größer als bei den einfachen Stichproben (Cochran 1977).
Wenn der Sampling-Frame Einheiten enthält, die nicht mehr existieren (z. B. weil die Sample-Frames falsch und veraltet sind), ist es unmöglich, Samples von solchen nicht existierenden Einheiten zu erhalten. Diese Situation verzerrt die Schätzungen nicht, vorausgesetzt, dass solche Fälle nicht durch nicht zufällige Methoden ersetzt werden und dass die ursprünglichen Stichprobengewichte ordnungsgemäß angepasst werden, um solche Stichprobenrahmenunvollkommenheiten zu berücksichtigen (dennoch haben Stichprobenrahmenunvollkommenheiten eindeutig Auswirkungen auf die Kosten, und wenn der Stichprobenumfang verringert wird, beeinflusst dies auch die Größe des Stichprobenfehlers).
Lösungen für die Verzerrung aufgrund von Nichtantworten sind viel artikulierter und können im Allgemeinen in Ex-Ante- und Ex-Post-Lösungen unterteilt werden (Groves et al. 1998). Ex-Ante-Lösungen versuchen, die Nichtantwort auf verschiedene Weise zu verhindern und zu minimieren (z. B. spezifisches Training von Enumeratoren, mehrere Versuche, den Befragten zu interviewen usw.).), während Ex-Post-Lösungen versuchen, zusätzliche Informationen über Nicht-Befragte zu sammeln, die dann verwendet werden, um eine Antwortwahrscheinlichkeit für verschiedene Populationsuntergruppen zu berechnen und so die Antwortdaten für die Umkehrung dieser Wahrscheinlichkeit oder alternativ eine Nachschichtung und Kalibrierung neu zu gewichten.
Sampling bias, sampling error, bias of probability function, and limited sampling bias
Das Konzept des Sampling Bias sollte nicht mit anderen verwandten, aber unterschiedlichen Konzepten wie „Sampling error“, „bias of a probability functional“ und „limited Sampling bias“ verwechselt werden. Der Stichprobenfehler eines Funktionals der Wahrscheinlichkeitsverteilung (z. B. die Varianz oder die Entropie der Verteilung) ist die Differenz zwischen der Schätzung des Wahrscheinlichkeitsfunktionals, das über die abgetastete Verteilung berechnet wurde, und dem korrekten Wert des Funktionals, das über die wahre Verteilung berechnet wurde. Der Bias eines Funktionals einer Wahrscheinlichkeitsverteilung ist definiert als der erwartete Wert des Abtastfehlers. Sampling Bias kann zu einer Verzerrung eines Wahrscheinlichkeitsfunktionals führen. Die beiden Konzepte sind jedoch nicht gleichwertig. Eine Verzerrung kann auftreten, wenn eine nichtlineare Funktion der Wahrscheinlichkeiten aus einer begrenzten Anzahl von experimentellen Stichproben gemessen wird, selbst wenn diese Stichproben wirklich zufällig aus der zugrunde liegenden Grundgesamtheit ausgewählt werden und somit keine Abtastverzerrung vorliegt. Dieser Bias wird als „Limited Sampling Bias“ bezeichnet. Im Folgenden geben wir ein Beispiel für die begrenzte Stichprobenverzerrung gegenseitiger Informationen.
Der Effekt begrenzter Stichproben auf die Bestimmung statistischer und kausaler Zusammenhänge
\(\tag{1}I(X;Y) = \sum_{x,y} P(x,y) \, log_2 \frac{P(x,y)}{P(x) \cdot P(y)}\)
In der Praxis kann es jedoch schwierig sein, \(I(X;Y)\) zu messen, da die genauen Werte der Wahrscheinlichkeiten \(P(x), P(y) und P(x,y)\) normalerweise unbekannt sind. Es mag im Prinzip einfach sein, diese Wahrscheinlichkeiten aus beobachteten Häufigkeitsverteilungen in experimentellen Stichproben abzuschätzen, aber dies führt normalerweise zu voreingenommenen Schätzungen von \(I(X;Y)\ ,\), selbst wenn die zur Schätzung von \(P(x), P(y) und P(x,y)\) verwendeten Stichproben selbst unvoreingenommene, repräsentative Stichproben der zugrunde liegenden Verteilungen von \(X\) und \(Y\ sind.\) Diese besondere Art der Verzerrung wird als „begrenzte Abtastverzerrung“ bezeichnet und ist definiert als die Differenz zwischen dem erwarteten Wert der Wahrscheinlichkeitsfunktion, der aus den mit \ (N \) Abtastwerten geschätzten Wahrscheinlichkeitsverteilungen berechnet wird, und ihrem Wert, der aus den tatsächlichen Wahrscheinlichkeitsverteilungen berechnet wird.
Abbildung 2: Die begrenzte Abtastrate. Simulation eines „uninformativen“ Systems, dessen diskrete Antwort y mit einer gleichmäßigen Verteilung im Bereich von 1 bis 10 verteilt ist, unabhängig davon, welcher von zwei Werten einer mutmaßlichen erklärenden Variablen x dargestellt wurde. Beispiele für Histogramme der empirischen Antwortwahrscheinlichkeit (rote durchgezogene Linien), die aus 40 und 200 Beobachtungen (obere bzw. untere Reihe) abgetastet wurden, sind in der linken und mittleren Spalte (Antworten auf x = 1 bzw. x = 2) dargestellt. Die schwarz gepunktete horizontale Linie ist die wahre Antwortverteilung. Die rechte Spalte zeigt (als blaue Histogramme) die Verteilung (über 5000 Simulationen) der gegenseitigen Informationswerte, die mit 40 (oben) bzw. 200 (unten) Beobachtungen erhalten wurden. Wenn die Anzahl der Beobachtungen zunimmt, nimmt die begrenzte Abtastverzerrung ab. Die gestrichelte grüne vertikale Linie in den rechten Spalten zeigt den wahren Wert der gegenseitigen Information an, die vom simulierten System übertragen wird (was 0 Bits entspricht).
Betrachten Sie als Beispiel eine hypothetische Antwortvariable \(Y\), die gleichmäßig im Bereich 1-10 verteilt ist, und eine „erklärende Variable“ \(X\), die Werte von 1 oder 2 annehmen kann. Nehmen wir an, dass diese in Wirklichkeit völlig unabhängig voneinander sind, und daher kann das Beobachten von Werten von \(x\) nicht helfen, wahrscheinliche Werte von \ (y \) vorherzusagen.Ein Experimentator, der nach möglichen Beziehungen zwischen \(X\) und \(Y\) sucht, weiß dies jedoch nicht. In diesem Fall ist die wahre bedingte Wahrscheinlichkeit \(P(y | x)\) 0.1 (Abbildung 2A und Abbildung 2B, schwarze gepunktete Linie) für alle Kombinationen von \(x\) und \(y\ ,\), was bedeutet, dass \(P(y)\) ebenfalls 0,1 ist; folglich ist der wahre Wert der gegenseitigen Information null. Abbildung 2A und Abbildung 2B zeigen experimentelle Beobachtungsfrequenzen (rote Kurven), die aus einem simulierten Experiment mit \ (N \) = 40 Proben (20 Proben für jeden Wert von \ (x \)) erhalten wurden. In diesem simulierten Beispiel wurden die Stichproben wirklich zufällig und korrekt aus den zugrunde liegenden Wahrscheinlichkeitsverteilungen entnommen, und somit gab es keine Stichprobenverzerrung. Aufgrund der begrenzten Abtastung unterscheiden sich die geschätzten Wahrscheinlichkeiten (rote Linie von Abbildung 2A und Abbildung 2B) jedoch deutlich von 0,1 und voneinander, und die gegenseitige Informationsschätzung, die durch Einstecken der experimentell erhaltenen Schätzungen in die obige Formel erhalten wird, ist ungleich Null (0,2 Bit). Wenn man das simulierte Experiment immer wieder wiederholt, erhält man jedes Mal etwas andere Ergebnisse (Abbildung 2C): Die aus \(N\) = 40 Proben berechnete Informationsverteilung ist auf 0,202 Bit zentriert – und nicht auf den wahren Wert von 0 Bit. Dies zeigt, dass die gegenseitige Informationsschätzung unter einer begrenzten Abtastverzerrung leidet. Je größer die Anzahl der Abtastungen ist, desto geringer sind die Schwankungen der geschätzten Wahrscheinlichkeiten und folglich die begrenzte Abtastverzerrung. Zum Beispiel mit \ (N\) = 200 Proben; (100 Proben für jeden Wert von \ (x\ ;\) Abbildung 2D-F), die begrenzte Abtastvorspannung der gegenseitigen Information beträgt 0,033 Bit. Ähnliche Probleme gelten auch für Maßnahmen der kausalen Beziehungen wie Granger-Kausalität und Transfer-Entropie. Beachten Sie, dass die begrenzte Abtastverzerrung entsteht, weil die gegenseitige Information eine nichtlineare Funktion der Wahrscheinlichkeiten ist. Die Wahrscheinlichkeiten selbst wären von einer begrenzten Abtastverzerrung nicht betroffen, da sie über viele Wiederholungen des Experiments mit einer endlichen Anzahl von Daten zu den wahren Wahrscheinlichkeiten mitteln würden.Begrenzte Abtastverzerrungen können korrigiert werden, indem der angenäherte Wert analytisch berechnet und subtrahiert wird oder indem vorherige Informationen über die zugrunde liegenden Wahrscheinlichkeitsverteilungen verwendet werden, um ihre statistischen Abtastschwankungen zu reduzieren (Panzeri et al. 2007).
Sampling Bias in den Neurowissenschaften
In den letzten Jahren hat das Interesse an der Wirkung von Sampling Bias und begrenztem Sampling Bias in den Neurowissenschaften zugenommen. Ein wichtiges Problem in den sensorischen Neurowissenschaften ist es zu verstehen, wie Netzwerke von Neuronen sensorische Informationen darstellen und austauschen, indem sie ein koordiniertes Muster der Reaktion auf Reize bilden. Ein weit verbreiteter empirischer Ansatz für dieses Problem besteht darin, die von Neuronen emittierten Aktionspotentiale extrazellulär aufzuzeichnen. Extrazelluläre Elektroden werden häufig an einem ausgewählten Gehirnort platziert, da Aktionspotentiale erkannt werden können. Es ist bekannt, dass dieses Verfahren die Abtastung in Richtung größerer Neuronen (die Signale aussenden, die leichter zu erkennen sind) und in Richtung der aktivsten Neuronen (Shoham et al. 2006). Dies hängt in gewisser Weise mit dem oben diskutierten Problem der ‚Convenience Sampling‘ zusammen. Neurowissenschaftler berichten eher über das Verhalten der Neuronen, die mit den ihnen zur Verfügung stehenden Methoden am einfachsten („bequemsten“) beobachtet werden können. Um diese Abtastverzerrung zu korrigieren, müssen auch kleinere und weniger aktive Neuronen aufgezeichnet und unter Verwendung verschiedener Arten anatomischer und funktioneller Informationen die relativen Verteilungen verschiedener Arten neuronaler Populationen ausgewertet werden. Die Auswirkungen dieses Stichprobenproblems und Möglichkeiten, es zu berücksichtigen, werden in (Shoham et al. 2006). Die begrenzte Stichprobenverzerrung führt zu Problemen bei der Bestimmung des Kausalzusammenhangs zwischen sensorischen Reizen und bestimmten Merkmalen der neuronalen Populationsreaktionen, da sie die bei komplexen Charakterisierungen der neuronalen Antworten verfügbaren gegenseitigen Informationen (z. B. solche, die auf den genauen Zeitpunkten der Aktionspotentiale basieren) künstlich erhöhen kann gegenüber den Informationen, die bei einer einfacheren Charakterisierung der neuronalen Aktivität verfügbar sind (z. B. solche, die die Details der zeitlichen Struktur der neuronalen Antwort vernachlässigen). Die Auswirkungen dieses Stichprobenproblems und Möglichkeiten zur Korrektur werden in (Panzeri et al. 2007).