Curator: Cesare Magri
Ludovico Carraro
Eugene M. Izhikevich
Stefano Panzeri
Nick Orbeck
sampling bias innebär att proverna av en stokastisk variabel som samlas in för att bestämma dess fördelning väljs felaktigt och representerar inte den sanna fördelningen på grund av icke-slumpmässiga skäl. Låt oss överväga ett specifikt exempel: vi kanske vill förutsäga resultatet av ett presidentval genom en opinionsundersökning. Att fråga 1000 väljare om deras röstintentioner kan ge en ganska exakt förutsägelse av den troliga vinnaren, men bara om vårt urval av 1000 väljare är ’representativt’ för väljarna som helhet (dvs. opartisk). Om vi bara pollar yttrandet från 1000 vita medelklassstudenter, kommer synpunkterna från många viktiga delar av väljarna som helhet (etniska minoriteter, äldre människor, arbetare) sannolikt att vara underrepresenterade i urvalet, och vår förmåga att förutsäga resultatet av valet från det urvalet minskas.
i ett opartiskt prov bör skillnader mellan de prover som tagits från en slumpmässig variabel och dess sanna fördelning, eller skillnader mellan proverna av enheter från en population och hela populationen de representerar, endast bero på en slump. Om deras skillnader inte bara beror på chans, så finns det en provtagningsförspänning. Provtagningsförspänning uppstår ofta eftersom vissa värden på variabeln systematiskt är underrepresenterade eller överrepresenterade med avseende på den verkliga fördelningen av variabeln (som i vårt opinionsundersökningsexempel ovan). På grund av dess konsekventa karaktär leder provtagningsförskjutning till en systematisk snedvridning av uppskattningen av den sannolikhetsfördelningen i urvalet. Denna snedvridning kan inte elimineras genom att antalet dataprover ökas och måste korrigeras med hjälp av lämpliga tekniker, av vilka några diskuteras nedan. Med andra ord, att rösta ytterligare 1000 vita högskolestudenter kommer inte att förbättra den prediktiva kraften i vår opinionsundersökning, men att rösta 1000 personer som valts slumpmässigt från röstlängden skulle. Självklart kan ett partiskt prov orsaka problem i måttet på sannolikhetsfunktioner (t. ex., variansen eller entropin av distributionen), eftersom all statistik som beräknas från det urvalet har potential att vara konsekvent felaktig.
- innehåll
- orsaker till provtagningsförspänning
- korrigering och minskning av provtagningsförspänning
- Provtagningsförspänning, provtagningsfel, förspänning av sannolikhetsfunktion och begränsad provtagningsförspänning
- effekten av begränsad provtagning på bestämningen av statistiska och orsakssamband
- Provtagningsbias i neurovetenskap
innehåll
- 1 Orsaker till provtagningsbias
- 2 korrigering och reduktion av provtagningsbias
- 3 Provtagningsbias, provtagningsfel, förspänning av sannolikhetsfunktion och begränsad provtagningsbias
- 4 effekten av begränsad provtagning på bestämning av statistiska och kausala förhållanden
- 5 Provtagningsbias i neurovetenskap
- 6 Referenser
- 7 Externa länkar
- 8 Se även
orsaker till provtagningsförspänning
en vanlig orsak till provtagningsförspänning ligger i utformningen av studien eller i datainsamlingen förfarande, som båda kan gynna eller missgynna insamling av data från vissa klasser eller individer eller under vissa förhållanden. Provtagningsförspänning är också särskilt framträdande när forskare antar provtagningsstrategier baserade på bedömning eller bekvämlighet, där kriteriet som används för att välja prover på något sätt är relaterat till variablerna av intresse. Till exempel, med hänvisning till opinionsundersökningsexemplet, kan en akademisk forskare som samlar in opinionsdata på grund av bekvämlighet välja att samla åsikter mestadels från högskolestudenter eftersom de råkar bo i närheten, och detta kommer ytterligare att leda provtagningen mot den åsikt som förekommer i den sociala klassen som bor i grannskapet.
Figur 1: möjliga förspänningskällor som förekommer vid valet av ett prov från en population.
i sociala och ekonomiska vetenskaper kräver extrahering av slumpmässiga prover vanligtvis en provtagningsram, såsom listan över enheterna i hela befolkningen, eller viss hjälpinformation om några viktiga egenskaper hos målpopulationen som ska provas. Till exempel, genomföra en studie om grundskolor i ett visst land kräver att få en lista över alla skolor i landet, från vilken ett prov kan extraheras. Att använda en provtagningsram förhindrar emellertid inte nödvändigtvis provtagningsförspänning. Till exempel kan man misslyckas med att korrekt bestämma målpopulationen eller använda föråldrad och ofullständig information, vilket utesluter delar av målpopulationen. Dessutom, även när provtagningsramen väljs korrekt, kan provtagningsförspänning uppstå från icke-responsiva provtagningsenheter (t.ex. vissa klasser av ämnen kan vara mer benägna att vägra att delta, eller kan vara svårare att kontakta etc.) Icke-svar är särskilt troliga att orsaka bias när orsaken till icke-svar är relaterad till fenomenet som studeras. Figur 1 illustrerar hur missmatchningarna mellan provtagningsramen och målpopulationen, såväl som icke-svar, kan bias provet.
i experiment inom fysikaliska och biologiska vetenskaper uppstår provtagningsförspänning ofta när målvariabeln som ska mätas under experimentet (t.ex. energin i ett fysiskt system) är korrelerad med andra faktorer (t. ex. systemets temperatur) som hålls fasta eller begränsade inom ett kontrollerat område under experimentet. Tänk till exempel på bestämningen av sannolikhetsfördelningen av hastigheten på alla bilar på brittiska vägar när som helst under en viss dag. Hastigheten är definitivt relaterad till plats: därför kan mäthastighet endast vid vissa typer av platser förspänna provet. Till exempel, om alla åtgärder vidtas vid upptagna trafikkorsningar i stadens centrum, kommer den provtagna fördelningen av bilhastigheter inte att vara representativ för Storbritanniens bilar och kommer att vara starkt partisk mot låga hastigheter, eftersom den försummar bilar som reser på motorvägar och på andra snabba vägar. Det är viktigt att notera att en systematisk snedvridning av en samplad fördelning av en slumpvariabel också kan bero på andra faktorer än provtagningsförspänning, såsom ett systematiskt fel i de instrument som används för att samla in provdata. Med tanke på igen exemplet på fördelningen av bilens hastighet i Storbritannien, och antar att experimenten har tillgång till samtidig avläsning av hastighetsmätarna placerade på varje bil, så att det inte finns någon provtagningsförspänning. Om de flesta hastighetsmätare är inställda för att överskatta hastigheten och att överskatta den mer vid högre hastighet, kommer den resulterande samplade fördelningen att vara förspänd mot höga hastigheter.
korrigering och minskning av provtagningsförspänning
för att minska provtagningsförspänning är de två viktigaste stegen vid utformningen av en studie eller ett experiment (i) för att undvika bedömning eller bekvämlighetsprovtagning (ii) för att säkerställa att målpopulationen är korrekt definierad och att provramen matchar den så mycket som möjligt. När begränsade resurser eller effektivitetsskäl begränsar möjligheten att ta prov på hela befolkningen, bör man se till att de uteslutna populationerna inte skiljer sig från den totala befolkningen när det gäller den statistik som ska mätas. I samhällsvetenskap är befolkningsrepresentativa undersökningar oftast inte enkla slumpmässiga prover, men följer mer komplexa provdesigner (Cochran 1977). Till exempel, i en typisk hushållsundersökning väljs ett urval av hushåll i två steg: i ett första steg finns ett urval av byar eller delar av städer (kluster) och i ett andra steg väljs ett visst antal hushåll inom samma kluster. När man antar sådana komplexa provkonstruktioner är det viktigt att säkerställa att provraminformationen används korrekt och att sannolikheten och slumpmässigt urval implementeras och dokumenteras i varje steg i provtagningsprocessen. I själva verket är sådan information nödvändig för att beräkna objektiva uppskattningar för befolkningen med hjälp av provtagningsvikter (motsatsen till sannolikheten för urval) och med hänsyn till provtagningsdesignen för att korrekt beräkna provtagningsfelet. I komplexa provdesigner kommer provtagningsfelet alltid att vara större än i de enkla slumpmässiga proverna (Cochran 1977).
När provtagningsramen innehåller enheter som inte längre finns (t.ex. eftersom provramarna är felaktiga och föråldrade) är det omöjligt att få några prover från sådana icke befintliga enheter. Denna situation snedvrider inte uppskattningarna, förutsatt att sådana fall inte ersätts med icke-slumpmässiga metoder, och att originalprovtagningsvikterna är korrekt justerade för att ta hänsyn till sådana brister i provramen (ändå har brister i provramen tydligt kostnadseffekter och om provstorleken minskas påverkar detta också storleken på provtagningsfelet).
lösningar på bias på grund av bristande svar är mycket mer ledade och kan i allmänhet delas in i förhands-och efterhandslösningar (Groves et al. 1998). Förhands lösningar försöker förebygga och minimera uteblivna svar på olika sätt (till exempel särskild utbildning av uppräkare, flera försök att intervjua svaranden, etc.) efterhandslösningar försöker samla in extra information om icke-respondenter som sedan används för att beräkna en sannolikhet för svar för olika befolkningsundergrupper och så återviktssvarsdata för inversen av sådan sannolikhet eller alternativt någon post-stratifiering och kalibrering.
Provtagningsförspänning, provtagningsfel, förspänning av sannolikhetsfunktion och begränsad provtagningsförspänning
begreppet provtagningsförspänning bör inte förväxlas med andra relaterade men distinkta begrepp som ”provtagningsfel”, ”förspänning av en sannolikhetsfunktionell” och ”begränsad provtagningsförspänning”. Provtagningsfelet för en funktion av sannolikhetsfördelningen (såsom variansen eller entropin för fördelningen) är skillnaden mellan uppskattningen av sannolikhetsfunktionen beräknad över den samplada fördelningen och det korrekta värdet av den funktionella beräknad över den verkliga fördelningen. Förspänningen av en funktion av en sannolikhetsfördelning definieras som det förväntade värdet av provtagningsfelet. Provtagning bias kan leda till en bias av en sannolikhet funktionell. De två begreppen är dock inte likvärdiga.
en bias kan uppstå vid mätning av en icke-linjär funktion av sannolikheterna från ett begränsat antal experimentella prover även när dessa prover verkligen slumpmässigt plockas från den underliggande populationen och det finns således ingen provtagningsförspänning. Denna bias kallas ”begränsad provtagningsbias”. Vi kommer att ge nedan ett exempel på den begränsade provtagningsförskjutningen av ömsesidig information.
effekten av begränsad provtagning på bestämningen av statistiska och orsakssamband
\(\tag{1}i (X;Y) = \sum_{x,y} P(x,y)\, log_2 \frac{P(x,y)} {P(x) \cdot P(y)}\)
i praktiken kan det dock vara svårt att mäta \(i(X;Y)\) eftersom de exakta värdena för sannolikheterna \(P(x), P(y) och P(x, y)\) vanligtvis är okända. Det kan i princip vara lätt att uppskatta dessa sannolikheter från observerade frekvensfördelningar i experimentella prover, men detta leder vanligtvis till partiska uppskattningar av \(i(X;Y)\ ,\) även om proverna som används för att uppskatta \(P(x), P(y) och P(x,y)\) själva är objektiva, representativa prover av de underliggande fördelningarna av \(X\) och \(Y\).\ ) Denna speciella typ av bias kallas ”begränsad samplingsbias” och definieras som skillnaden mellan det förväntade värdet av sannolikhetsfunktionen beräknad från sannolikhetsfördelningarna uppskattade med \(N\) prover och dess värde beräknat från de sanna sannolikhetsfördelningarna.
Figur 2: den begränsade provtagningsförspänningen. Simulering av ett” uninformativt ” system vars diskreta svar y distribueras med en enhetlig fördelning som sträcker sig från 1 till 10, oavsett vilket av två värden av en förmodad förklarande variabel x presenterades. Exempel på empiriska svarssannolikhetshistogram (röda fasta linjer) som samplades från 40 respektive 200 observationer (övre respektive nedre raden) visas i de vänstra och centrala kolumnerna (svar på x = 1 respektive x = 2). Den svarta prickade horisontella linjen är den sanna svarsfördelningen. Den högra kolumnen visar (som blå histogram) fördelningen (över 5000 simuleringar) av de ömsesidiga informationsvärdena erhållna med 40 (topp) respektive 200 (botten) observationer. När antalet observationer ökar minskar den begränsade provtagningsförskjutningen. Den streckade gröna vertikala linjen i de högra kolumnerna indikerar det sanna värdet av den ömsesidiga informationen som bärs av det simulerade systemet (vilket motsvarar 0 bitar).
Tänk som exempel på en hypotetisk responsvariabel \(Y\) som är jämnt fördelad i intervallet 1-10 och en ”förklarande variabel” \(X\) som kan anta värden på antingen 1 eller 2. Låt oss anta att dessa i verkligheten är helt oberoende av varandra, och att observera värden på \(x\) kan därför inte hjälpa till att förutsäga sannolika värden på \(y\ .\ ) Men en experimentalist som söker efter möjliga relationer mellan \(X\) och \(Y\) vet inte detta. I detta fall är den sanna villkorliga sannolikheten \(P(y|x)\) 0.1 (figur 2a och Figur 2B, svart streckad linje) för alla kombinationer av \(x\)och \(y\ ,\) vilket betyder att \(P(y)\) också är 0,1; följaktligen är det sanna värdet av den ömsesidiga informationen null. Figur 2a och Figur 2B visar experimentella observationsfrekvenser (röda kurvor) erhållna från ett simulerat experiment med \(N\)= 40 prover (20 prover för varje värde av \(x\)). I detta simulerade exempel togs proverna verkligen slumpmässigt och korrekt från de underliggande sannolikhetsfördelningarna, och därför fanns det ingen provtagningsförspänning. På grund av begränsad provtagning skiljer sig emellertid de uppskattade sannolikheterna (röd linje i Figur 2a och Figur 2B) markant från 0,1 och från varandra, och den ömsesidiga informationsuppskattningen som erhållits genom att ansluta de experimentellt erhållna uppskattningarna till formeln ovan är icke-null (0,2 bitar). Genom att upprepa det simulerade experimentet om och om igen får man något olika resultat varje gång ( figur 2C): informationsfördelningen beräknad från \(N\)= 40 prover är centrerad vid 0,202 bitar – och inte vid det sanna värdet av 0 bitar. Detta visar att den ömsesidiga informationsuppskattningen lider av begränsad provtagningsförspänning. Ju större antal prover, desto mindre fluktuationerna i de uppskattade sannolikheterna, och följaktligen desto mindre är den begränsade provtagningsförspänningen. Till exempel, med \(N\)= 200 prover; (100 prover för varje värde av \(x\ ;\) figur 2D-F) är den begränsade provtagningsförspänningen för ömsesidig information 0,033 bitar. Liknande problem gäller även mått på orsakssamband som Granger-kausalitet och överföringsentropi. Observera att den begränsade provtagningsförspänningen uppstår eftersom ömsesidig information är en olinjär funktion av sannolikheterna. Sannolikheterna själva skulle påverkas av begränsad provtagningsförspänning, eftersom de skulle genomsnittliga till de sanna sannolikheterna över många repetitioner av experimentet med ett begränsat antal data.
begränsad provtagningsförspänning kan korrigeras genom att beräkna dess approximerade värde analytiskt och subtrahera det, eller genom att använda tidigare information om de underliggande sannolikhetsfördelningarna för att minska deras statistiska provtagningsfluktuationer (Panzeri et al. 2007).
Provtagningsbias i neurovetenskap
under de senaste åren har det ökat intresset för effekten av provtagningsbias och begränsad provtagningsbias i neurovetenskap. Ett viktigt problem i sensorisk neurovetenskap är att förstå hur nätverk av neuroner representerar och utbyter sensorisk information med hjälp av deras samordnade svarsmönster på stimuli. Ett allmänt använt empiriskt tillvägagångssätt för detta problem är att registrera extracellulärt de åtgärdspotentialer som emitteras av neuroner. Extracellulära elektroder placeras ofta i en hjärnplats vald eftersom åtgärdspotentialer kan detekteras. Det är erkänt att denna procedur kan förspänna provtagningen mot större neuroner (emitterande signaler som är lättare att upptäcka) och mot de flesta aktiva neuroner (Shoham et al. 2006). Detta är något relaterat till problemet med ’bekvämlighetsprovtagning’ som diskuterats ovan. Neuroscientists är mer benägna att rapportera beteendet hos de neuroner som lättast (”bekvämt”) observeras med de metoder som står till deras förfogande. Korrigering av denna provtagningsförspänning kräver inspelning också från mindre och mindre aktiva neuroner och utvärdering, med hjälp av olika typer av anatomisk och funktionell information, de relativa fördelningarna av olika typer av neurala populationer. Konsekvenserna av detta provtagningsproblem och sätt att ta hänsyn till det diskuteras i (Shoham et al. 2006). Den begränsade provtagningsförspänningen ger problem vid bestämningen av orsakssambandet mellan sensoriska stimuli och vissa egenskaper hos neuronala populationssvar, eftersom det artificiellt kan öka den ömsesidiga informationen som finns tillgänglig i komplexa karakteriseringar av neuronala svar (såsom de som baseras på de exakta tiderna för handlingspotentialer) över den information som finns tillgänglig i enklare karakterisering av neuronal aktivitet (såsom de som försummar detaljerna i den temporala strukturen hos neuronala svaret). Konsekvenserna av detta provtagningsproblem och sätt att korrigera för det diskuteras i (Panzeri et al. 2007).