Curator: Cesare Magri ‘
Ludovico Carraro
Eugene M. Izhikevich
Stefano Panzeri
Nick Orbeck
Sampling bias betekent dat de monsters van een stochastische variabele die worden verzameld bij het bepalen van de verdeling zijn geselecteerd onjuist en vertegenwoordigen niet de ware verdeling op grond van een niet-willekeurige redenen. Laten we eens kijken naar een specifiek voorbeeld: we zouden de uitkomst van een presidentsverkiezingen kunnen voorspellen door middel van een opiniepeiling. 1000 kiezers vragen naar hun stemintenties kan een vrij nauwkeurige voorspelling van de waarschijnlijke winnaar geven, maar alleen als onze steekproef van 1000 kiezers ‘representatief’ is van het electoraat als geheel (dat wil zeggen onbevooroordeeld). Als we slechts de mening van, 1000 blanke middenklasse studenten pollen, dan zijn de standpunten van veel belangrijke delen van het electoraat als geheel (etnische minderheden, ouderen, arbeiders) waarschijnlijk ondervertegenwoordigd in de steekproef, en ons vermogen om de uitkomst van de verkiezing van die steekproef te voorspellen is verminderd.
in een onbevooroordeelde steekproef mogen verschillen tussen de monsters van een willekeurige variabele en de werkelijke verdeling ervan, of verschillen tussen de monsters van eenheden van een populatie en de gehele populatie die zij vertegenwoordigen, alleen het gevolg zijn van toeval. Als hun verschillen niet alleen te wijten zijn aan toeval, dan is er een steekproef bias. Sampling bias ontstaat vaak omdat bepaalde waarden van de variabele systematisch ondervertegenwoordigd of oververtegenwoordigd zijn met betrekking tot de werkelijke verdeling van de variabele (zoals in ons opinieonderzoek voorbeeld hierboven). Vanwege het consistente karakter van de steekproef leidt een systematische vervorming van de schatting van de bemonsterde kansverdeling tot gevolg. Deze vervorming kan niet worden opgeheven door het aantal gegevensmonsters te verhogen en moet worden gecorrigeerd met behulp van geschikte technieken, waarvan sommige hieronder worden besproken. Met andere woorden, polling een extra 1000 witte studenten zal niet het verbeteren van de voorspellende kracht van onze opiniepeiling, maar polling 1000 personen willekeurig gekozen uit de kiezerslijst zou. Uiteraard kan een bevooroordeelde steekproef problemen veroorzaken in de meting van waarschijnlijkheidsfuncties (bijv. de variantie of de entropie van de distributie), aangezien alle statistieken die uit die steekproef worden berekend, mogelijk consistent onjuist zijn.
Inhoud
- 1 Oorzaken van de sampling bias
- 2 Correctie en vermindering van sampling bias
- 3 Sampling bias, sampling error, de afwijking van de waarschijnlijkheid van de functie, en limited sampling bias
- 4 Het effect van de beperkte monstername voor de bepaling van de statistische en de causale relaties
- 5 Sampling bias in de neurowetenschappen
- 6 Referenties
- 7 Externe links
- 8 Zie ook
Oorzaken van sampling bias
Een veel voorkomende oorzaak van sampling bias ligt in het ontwerp van de studie of bij de verzameling van gegevens procedure, die beide het verzamelen van gegevens van bepaalde klassen of individuen of in bepaalde omstandigheden kunnen bevoordelen of benadelen. Sampling bias is ook bijzonder prominent wanneer onderzoekers sampling strategieën op basis van oordeel of gemak, waarbij het criterium gebruikt om monsters te selecteren is een of andere manier gerelateerd aan de variabelen van belang. Bijvoorbeeld, opnieuw verwijzend naar de opiniepeiling voorbeeld, een academische onderzoeker verzamelen opiniegegevens kan kiezen, vanwege het gemak, om meningen meestal van studenten te verzamelen, omdat ze toevallig in de buurt wonen, en dit zal verder de bemonstering in de richting van de mening overwegend in de sociale klasse die in de buurt wonen.
figuur 1: mogelijke bronnen van bias die voorkomen bij de selectie van een steekproef uit een populatie.
in de sociale en economische wetenschappen vereist het extraheren van aselecte steekproeven doorgaans een steekproefkader, zoals de lijst van de eenheden van de gehele populatie, of enige aanvullende informatie over enkele belangrijke kenmerken van de te bemonsteren doelpopulatie. Voor het uitvoeren van een studie over basisscholen in een bepaald land is bijvoorbeeld het verkrijgen van een lijst van alle scholen in het land vereist, waaruit een monster kan worden gehaald. Het gebruik van een bemonsteringskader voorkomt echter niet noodzakelijk een bias van de bemonstering. Men kan bijvoorbeeld de doelpopulatie niet correct bepalen of verouderde en onvolledige informatie gebruiken, waardoor delen van de doelpopulatie worden uitgesloten. Bovendien kan, zelfs wanneer het bemonsteringskader op de juiste wijze is gekozen, de bemonsteringsbias voortkomen uit niet-responsieve bemonsteringseenheden (bijvoorbeeld, bepaalde klassen van proefpersonen zullen eerder weigeren deel te nemen, of kunnen moeilijker contact opnemen, enz.) Non-responsen veroorzaken met name vertekening wanneer de reden van non-respons verband houdt met het onderzochte fenomeen. Figuur 1 illustreert hoe de mismatches tussen steekproefkader en doelpopulatie, evenals non-responsen, de steekproef zouden kunnen beïnvloeden.
bij experimenten in de natuurkundige en biologische wetenschappen treedt de bemonsteringsbias vaak op wanneer de tijdens het experiment te meten doelvariabele (bv. de energie van een fysisch systeem) gecorreleerd is met andere factoren (bv. de temperatuur van het systeem) die tijdens het experiment vast of binnen een gecontroleerd bereik worden gehouden. Denk bijvoorbeeld aan de bepaling van de kansverdeling van de snelheid van alle auto ‘ s op Britse wegen op elk moment gedurende een bepaalde dag. Snelheid is zeker gerelateerd aan Locatie: daarom kan het meten van snelheid alleen op bepaalde soorten locaties het monster beïnvloeden. Als alle maatregelen bijvoorbeeld worden genomen op drukke verkeersknooppunten in het centrum van de stad, zal de steekproefsgewijze verdeling van de autosnelheden niet representatief zijn voor de auto ’s van Groot-Brittannië en sterk worden beïnvloed door lage snelheden, omdat Auto’ s die op snelwegen en andere snelle wegen rijden worden verwaarloosd. Het is belangrijk op te merken dat een systematische vervorming van een bemonsterde verdeling van een willekeurige variabele ook het gevolg kan zijn van andere factoren dan bemonsteringsbias, zoals een systematische fout in de instrumenten die worden gebruikt om de steekproefgegevens te verzamelen. Opnieuw rekening houdend met het voorbeeld van de verdeling van de snelheid van auto ‘ s in Groot-Brittannië, en stel dat de experimentator toegang heeft tot de gelijktijdige lezing van de snelheidsmeters geplaatst op elke auto, zodat er geen steekproef bias. Als de meeste snelheidsmeters zijn afgestemd om de snelheid te overschatten, en om het meer te overschatten bij hogere snelheid, dan zal de resulterende bemonsterde distributie worden beïnvloed door hoge snelheden.
correctie en vermindering van de bemonsteringsbias
om de bemonsteringsbias te verminderen, zijn de twee belangrijkste stappen bij het ontwerpen van een studie of experiment (i) om beoordelings-of gemaksbemonstering te voorkomen (ii) om ervoor te zorgen dat de doelpopulatie naar behoren is gedefinieerd en dat het steekproefkader daar zoveel mogelijk mee overeenkomt. Wanneer eindige hulpbronnen of efficiëntieredenen de mogelijkheid beperken om de gehele populatie te bemonsteren, moet ervoor worden gezorgd dat de Uitgesloten populaties niet verschillen van de totale populatie wat betreft de te meten statistieken. In de sociale wetenschappen zijn populatie representatieve enquêtes meestal niet eenvoudige willekeurige steekproeven, maar volgen meer complexe steekproefontwerpen (Cochran 1977). Bijvoorbeeld, in een typische huishoudenenquête wordt een steekproef van huishoudens in twee fasen geselecteerd: in een eerste fase is er een selectie van dorpen of delen van steden (cluster) en in een tweede fase wordt een bepaald aantal huishoudens binnen dezelfde cluster geselecteerd. Bij de vaststelling van dergelijke complexe steekproefontwerpen is het van essentieel belang ervoor te zorgen dat de informatie over het steekproefkader correct wordt gebruikt en dat de waarschijnlijkheid en de willekeurige selectie in elke fase van het bemonsteringsproces worden geïmplementeerd en gedocumenteerd. Dergelijke informatie is in feite essentieel om onbevooroordeelde schattingen voor de populatie te berekenen aan de hand van bemonsteringsgewichten (het omgekeerde van de kans op Selectie) en rekening houdend met het bemonsteringsontwerp om de bemonsteringsfout correct te berekenen. Bij complexe monsterontwerpen zal de monsterfout altijd groter zijn dan bij de eenvoudige aselecte monsters (Cochran 1977).
wanneer het bemonsteringskader eenheden omvat die niet meer bestaan (bijvoorbeeld omdat de monsterframes onjuist en verouderd zijn) is het onmogelijk om monsters van dergelijke niet bestaande eenheden te verkrijgen. Deze situatie vertekent de schattingen niet, op voorwaarde dat dergelijke gevallen niet worden vervangen met behulp van niet-willekeurige methoden en dat de oorspronkelijke bemonsteringsgewichten naar behoren worden aangepast om rekening te houden met dergelijke onvolkomenheden van het monsterkader (toch hebben onvolkomenheden van het monsterkader duidelijk gevolgen voor de kosten en als de steekproefgrootte kleiner wordt, heeft dit ook invloed op de grootte van de bemonsteringsfout).
oplossingen voor de bias als gevolg van non-respons zijn veel meer gearticuleerd, en kunnen over het algemeen worden onderverdeeld in ex-ante en ex-post oplossingen (Groves et al. 1998). Ex-ante oplossingen proberen non-respons op verschillende manieren te voorkomen en te minimaliseren (bijvoorbeeld specifieke training van opsommers, verschillende pogingen om de respondent te interviewen, enz.) terwijl ex-post oplossingen proberen om aanvullende informatie te verzamelen over niet-respondenten die vervolgens wordt gebruikt om een waarschijnlijkheid van respons te berekenen voor verschillende populatiesubgroepen en dus re-gewicht responsgegevens voor de inverse van deze waarschijnlijkheid of een andere poststratificatie en kalibratie.
sampling bias, sampling error, bias of probability function, and limited sampling bias
het concept sampling bias mag niet worden verward met andere gerelateerde maar verschillende concepten zoals “sampling error”, “bias of a probability functional” en “limited sampling bias”. De bemonsteringsfout van een functionele van de kansverdeling (zoals de variantie of de entropie van de verdeling) is het verschil tussen de schatting van de waarschijnlijkheidsfunctionaliteit berekend over de bemonsterde verdeling en de correcte waarde van de functionele berekend over de werkelijke verdeling. De bias van een functie van een kansverdeling wordt gedefinieerd als de verwachte waarde van de steekproeffout. Sampling bias kan leiden tot een bias van een waarschijnlijkheid functioneel. De twee begrippen zijn echter niet gelijkwaardig.
een bias kan ontstaan bij het meten van een niet-lineaire functie van de waarschijnlijkheden van een beperkt aantal experimentele monsters, zelfs wanneer deze monsters werkelijk willekeurig uit de onderliggende populatie worden gekozen en er dus geen bias van de bemonstering is. Deze bias wordt “limited sampling bias”genoemd. Hieronder geven we een voorbeeld van de beperkte steekproefvooroordeel van wederzijdse informatie.
het effect van beperkte steekproeven op de bepaling van statistische en causale verbanden
\(\tag{1}I (X;Y) = \sum_{x,y} P(x,y)\, log_2 \frac{P(x,y)} {P(x) \cdot P(y)}\)
in de praktijk kan het echter moeilijk zijn om \(I(X;Y)\) te meten omdat de exacte waarden van de waarschijnlijkheden \(P(X), P(y) en P(x, y)\) gewoonlijk onbekend zijn. Het kan in principe gemakkelijk zijn om deze waarschijnlijkheden te schatten op basis van waargenomen frequentieverdelingen in experimentele monsters, maar dit leidt meestal tot bevooroordeelde schattingen van \(I(X;Y)\ ,\) zelfs als de monsters die worden gebruikt om \(P(X), P(y) en P(x,y)\) te schatten zelf onbevooroordeelde, representatieve monsters zijn van de onderliggende distributies van \(X\) en \(Y\ .\ ) Dit specifieke type bias wordt de “beperkte sampling bias” genoemd, en wordt gedefinieerd als het verschil tussen de verwachte waarde van de waarschijnlijkheidsfunctie berekend uit de met \(N\) Monsters geschatte kansverdelingen, en de waarde berekend uit de echte kansverdelingen.
Figuur 2: de beperkte steekproefbias. Simulatie van een” niet-informatief ” systeem waarvan de discrete respons y wordt gedistribueerd met een uniforme verdeling variërend van 1 tot 10, ongeacht welke van de twee waarden van een vermeende verklarende variabele x werden gepresenteerd. Voorbeelden van empirische responswaarschijnlijkheid histogrammen (rode vaste lijnen) uit 40 en 200 waarnemingen (respectievelijk bovenste en onderste rij) worden weergegeven in de linker-en centrale kolom (responsen op respectievelijk x = 1 en x = 2). De zwarte gestippelde horizontale lijn is de ware responsverdeling. De rechterkolom toont (als blauwe histogrammen) de verdeling (meer dan 5000 simulaties) van de wederzijdse informatiewaarden verkregen met respectievelijk 40 (boven) en 200 (onder) waarnemingen. Naarmate het aantal waarnemingen toeneemt, neemt de beperkte steekproefbias af. De gestippelde groene verticale lijn in de juiste kolommen geeft de werkelijke waarde aan van de wederzijdse informatie die door het gesimuleerde systeem wordt gedragen (die gelijk is aan 0 bits).
neem bijvoorbeeld een hypothetische responsvariabele \(Y\) die gelijkmatig verdeeld is in het bereik 1-10, en een “verklarende variabele” \(X\) die waarden van 1 of 2 kan aannemen. Laten we aannemen dat deze in werkelijkheid volledig onafhankelijk van elkaar zijn, en daarom kan het observeren van waarden van \(x\) niet helpen om waarschijnlijke waarden van \(y\ te voorspellen .\ ) Een experimentalist die op zoek is naar mogelijke relaties tussen \(X\) en \(Y\) Weet dit echter niet. In dit geval is de ware voorwaardelijke kans \(P(y|x)\) 0.1(Figuur 2A en figuur 2B, zwarte stippellijn) voor alle combinaties van \(x\)en \(y\ ,\) wat betekent dat \(P (y)\) ook 0,1 is; bijgevolg is de ware waarde van de wederzijdse informatie nul. Figuur 2A en figuur 2B tonen experimentele waarnemingsfrequenties(rode krommen) verkregen uit een gesimuleerd experiment met \(N\)= 40 monsters(20 monsters voor elke waarde van \(x\)). In dit gesimuleerde voorbeeld werden de monsters echt willekeurig en correct genomen uit de onderliggende kansverdelingen, en dus was er geen steekproefbias. Door beperkte bemonstering verschillen de geschatte waarschijnlijkheden (rode lijn van figuur 2A en figuur 2B) echter aanzienlijk van 0,1 en van elkaar, en de wederzijdse informatieschatting verkregen door de experimenteel verkregen schattingen in de bovenstaande formule in te pluggen is niet-nul (0,2 bits). Het herhalen van het gesimuleerde experiment over en over, verkrijgt men telkens iets andere resultaten (figuur 2C): de informatiedistributie berekend uit \(N\)= 40 monsters is gecentreerd op 0,202 bits – en niet op de werkelijke waarde van 0 bits. Hieruit blijkt dat de schatting van de wederzijdse informatie aan een beperkte steekproefvooroordeel lijdt. Hoe groter het aantal monsters, hoe kleiner de schommelingen in de geschatte waarschijnlijkheden, en dus hoe kleiner de beperkte steekproefbias. Bijvoorbeeld, met \(N\) = 200 samples; (100 samples voor elke waarde van \(x\;\) figuur 2D-F), is de beperkte sampling bias van wederzijdse informatie 0,033 bits. Soortgelijke problemen zijn ook van toepassing op metingen van causale relaties zoals Granger causaliteit en overdracht entropie. Merk op dat de beperkte steekproefvooroordeel ontstaat omdat wederzijdse informatie een niet-lineaire functie van de waarschijnlijkheden is. De waarschijnlijkheden zelf zouden niet worden beïnvloed door beperkte steekproefbias, omdat zij zouden gemiddelde aan de ware waarschijnlijkheden over vele herhalingen van het experiment met een eindig aantal gegevens.
beperkte steekproefbias kan worden gecorrigeerd door de geschatte waarde analytisch te berekenen en af te trekken, of door voorafgaande informatie over de onderliggende kansverdelingen te gebruiken om hun statistische steekproeffluctuaties te verminderen (Panzeri et al. 2007).
Sampling bias in neurowetenschappen
De laatste jaren is er een groeiende belangstelling voor het effect van sampling bias en van beperkte sampling bias in neurowetenschappen. Een belangrijk probleem in de sensorische neurowetenschappen is om te begrijpen hoe netwerken van neuronen vertegenwoordigen en uitwisseling van sensorische informatie door middel van hun gecoördineerde patroon van reactie op stimuli. Een veelgebruikte empirische benadering van dit probleem is om extracellulair de actiepotentialen te registreren die door neuronen worden uitgezonden. De extracellulaire elektroden worden vaak geplaatst in een geselecteerde hersenenlocatie omdat actiepotentialen kunnen worden ontdekt. Het wordt erkend dat deze procedure de bemonstering naar grotere neuronen kan beïnvloeden (het uitzenden van signalen die gemakkelijker te detecteren zijn) en naar de meeste actieve neuronen (Shoham et al. 2006). Dit houdt enigszins verband met het hierboven besproken probleem van de “convenience sampling”. Neurowetenschappers hebben meer kans om het gedrag van die neuronen te melden die het gemakkelijkst (“gemakshalve”) worden waargenomen met de methoden tot hun beschikking. Het corrigeren van deze steekproefvooroordeel vereist registratie ook van kleinere en minder actieve neuronen en het evalueren, gebruikend diverse types van anatomische en functionele informatie, de relatieve distributies van verschillende types van neurale populaties. De implicaties van dit steekproefprobleem en manieren om er rekening mee te houden worden besproken in (Shoham et al. 2006). De beperkte steekproefbias geeft problemen in de bepaling van de causale relatie tussen sensorische stimuli en bepaalde kenmerken van de neuronale populatiereacties, omdat het de wederzijdse informatie beschikbaar in complexe karakteriseringen van de neuronale reacties (zoals die gebaseerd op de nauwkeurige tijden van actiepotentialen) over de beschikbare informatie in eenvoudigere karakterisering van de neuronale activiteit (zoals die welke de details van de temporele structuur van de neuronale reactie verwaarlozen kunstmatig kan verhogen. De implicaties van deze steekproef probleem en manieren om te corrigeren voor het worden besproken in (Panzeri et al. 2007).