kurator: Cesare Magri
Ludovico Carraro
Eugene M. Jigevich
Stefano 0.17 –
Nick Orbeck
sampling bias betyder, at prøverne af en stokastisk variabel, der indsamles for at bestemme dens fordeling, er valgt forkert og repræsenterer ikke den sande fordeling på grund af ikke – tilfældige grunde. Lad os overveje et specifikt eksempel: vi ønsker måske at forudsige resultatet af et præsidentvalg ved hjælp af en meningsmåling. At spørge 1000 vælgere om deres afstemningsintentioner kan give en ret præcis forudsigelse af den sandsynlige vinder, men kun hvis vores stikprøve på 1000 vælgere er ‘repræsentativ’ for vælgerne som helhed (dvs.upartisk). Hvis vi kun afstemmer udtalelsen fra 1000 hvide middelklassestuderende, vil synspunkterne fra mange vigtige dele af vælgerne som helhed (etniske minoriteter, ældre mennesker, funktionærer) sandsynligvis være underrepræsenteret i stikprøven, og vores evne til at forudsige resultatet af valget fra denne stikprøve reduceres.
i en upartisk prøve skal forskelle mellem prøverne taget fra en tilfældig variabel og dens sande fordeling eller forskelle mellem prøverne af enheder fra en population og hele den population, de repræsenterer, kun skyldes tilfældigheder. Hvis deres forskelle ikke kun skyldes tilfældigheder, så er der en prøveudtagningsforstyrrelse. Prøveudtagningsforstyrrelse opstår ofte, fordi visse værdier af variablen systematisk er underrepræsenteret eller overrepræsenteret med hensyn til den sande fordeling af variablen (som i vores meningsmålingseksempel ovenfor). På grund af dets konsekvente karakter fører prøveudtagningsforstyrrelser til en systematisk forvrængning af estimatet af den stikprøveudtagne sandsynlighedsfordeling. Denne forvrængning kan ikke elimineres ved at øge antallet af dataprøver og skal korrigeres ved hjælp af passende teknikker, hvoraf nogle diskuteres nedenfor. Med andre ord vil afstemning af yderligere 1000 hvide universitetsstuderende ikke forbedre forudsigelsesstyrken i vores meningsmåling, men afstemning af 1000 personer valgt tilfældigt fra valglisten ville. Det er klart, at en forudindtaget prøve kan forårsage problemer i målingen af sandsynlighedsfunktioner (f. eks., variansen eller entropien i distributionen), da enhver statistik beregnet ud fra denne prøve har potentialet til at være konsekvent fejlagtig.
- indhold
- årsager til prøveudtagningsforstyrrelse
- korrektion og reduktion af prøveudtagningsforstyrrelse
- Prøveudtagningsforstyrrelse, prøveudtagningsfejl, bias af sandsynlighedsfunktion og begrænset prøveudtagningsforstyrrelse
- effekten af begrænset prøveudtagning på bestemmelsen af statistiske og årsagssammenhænge
- Prøveudtagningsbias inden for neurovidenskab
indhold
- 1 Årsager til prøveudtagningsbias
- 2 korrektion og reduktion af prøveudtagningsbias
- 3 Prøveudtagningsbias, prøveudtagningsfejl, bias af sandsynlighedsfunktion og begrænset prøveudtagningsbias
- 4 effekten af begrænset prøveudtagning på bestemmelsen af statistiske og årsagsforhold
- 5 Prøveudtagningsbias i neurovidenskab
- 6 referencer
- 7 eksterne links
- 8 Se også
årsager til prøveudtagningsforstyrrelse
en almindelig årsag til prøveudtagningsforstyrrelse ligger i undersøgelsens design eller i dataindsamlingen procedure, som begge kan favorisere eller disfavor indsamling af data fra bestemte klasser eller enkeltpersoner eller under visse betingelser. Prøveudtagningsforstyrrelse er også særlig fremtrædende, når forskere vedtager prøveudtagningsstrategier baseret på vurdering eller bekvemmelighed, hvor kriteriet, der bruges til at vælge prøver, på en eller anden måde er relateret til variablerne af interesse. For eksempel, der henviser igen til meningsmålingseksemplet, en akademisk forsker, der indsamler meningsdata, kan vælge, på grund af bekvemmelighed, at indsamle meninger mest fra universitetsstuderende, fordi de tilfældigvis bor i nærheden, og dette vil yderligere påvirke prøveudtagningen mod den opfattelse, der er fremherskende i den sociale klasse, der bor i nabolaget.
Figur 1: mulige kilder til bias, der forekommer i udvælgelsen af en prøve fra en population.
i sociale og økonomiske videnskaber kræver udtrækning af tilfældige prøver typisk en prøveudtagningsramme såsom listen over enhederne i hele befolkningen eller nogle hjælpeoplysninger om nogle nøglekarakteristika for målpopulationen, der skal udtages. For eksempel kræver gennemførelse af en undersøgelse om grundskoler i et bestemt land at få en liste over alle skoler i landet, hvorfra en prøve kan udvindes. Brug af en prøveudtagningsramme forhindrer dog ikke nødvendigvis prøveudtagningsforstyrrelser. For eksempel kan man undlade at bestemme målpopulationen korrekt eller bruge forældede og ufuldstændige oplysninger og derved udelukke dele af målpopulationen. Desuden, selv når prøveudtagningsrammen er valgt korrekt, kan prøveudtagningsforstyrrelser opstå fra ikke-responsive prøveudtagningsenheder (f.eks.) Ikke-svar er især tilbøjelige til at forårsage bias, når årsagen til manglende respons er relateret til det undersøgte fænomen. Figur 1 illustrerer, hvordan uoverensstemmelserne mellem prøveudtagningsramme og målpopulation, såvel som ikke-svar, kunne bias prøven.
i eksperimenter inden for fysiske og biologiske videnskaber forekommer prøveudtagningsforstyrrelse ofte, når målvariablen, der skal måles under eksperimentet (f.eks. energien i et fysisk system) er korreleret med andre faktorer (f. eks. systemets temperatur), der holdes fast eller begrænset inden for et kontrolleret område under eksperimentet. Overvej for eksempel bestemmelsen af sandsynlighedsfordelingen af hastigheden på alle biler på britiske veje til enhver tid i løbet af en bestemt dag. Hastighed er bestemt relateret til placering: derfor kan måling af hastighed kun på bestemte typer placeringer forringe prøven. For eksempel, hvis alle foranstaltninger træffes ved travle trafikkryds i byens centrum, vil fordelingen af bilhastigheder i stikprøven ikke være repræsentativ for Storbritanniens biler og vil være stærkt partisk mod langsomme hastigheder, fordi den forsømmer biler, der kører på motorveje og på andre hurtige veje. Det er vigtigt at bemærke, at en systematisk forvrængning af en stikprøvefordeling af en tilfældig variabel også kan skyldes andre faktorer end prøveudtagningsforstyrrelse, såsom en systematisk fejl i de instrumenter, der bruges til at indsamle prøvedataene. I betragtning af eksemplet på fordelingen af bilernes hastighed i Storbritannien og antag, at eksperimentatoren har adgang til samtidig læsning af hastighedsmålere placeret på hver bil, så der ikke er nogen prøveudtagningsforstyrrelse. Hvis de fleste hastighedsmålere er indstillet til at overvurdere hastigheden og overvurdere den mere ved højere hastighed, vil den resulterende samplede fordeling være forudindtaget mod høje hastigheder.
korrektion og reduktion af prøveudtagningsforstyrrelse
for at reducere prøveudtagningsforstyrrelse er de to vigtigste trin ved design af en undersøgelse eller et eksperiment (i) for at undgå vurdering eller bekvemmelighed af prøveudtagning (ii) for at sikre, at målpopulationen er korrekt defineret, og at prøverammen matcher den så meget som muligt. Når begrænsede ressourcer eller effektivitetsårsager begrænser muligheden for at prøve hele befolkningen, skal man sørge for, at de udelukkede populationer ikke adskiller sig fra den samlede med hensyn til de statistikker, der skal måles. I samfundsvidenskab er befolkningsrepræsentative undersøgelser oftest ikke enkle tilfældige prøver, men følger mere komplekse prøvedesign (Cochran 1977). For eksempel, i en typisk husstandsundersøgelse vælges en stikprøve af husstande i to faser: i en første fase er der et udvalg af landsbyer eller dele af byer (klynge), og i en anden fase vælges et bestemt antal husstande inden for den samme klynge. Ved vedtagelse af sådanne komplekse prøvedesign er det vigtigt at sikre, at oplysningerne om prøverammen anvendes korrekt, og at sandsynligheden og tilfældig udvælgelse implementeres og dokumenteres på hvert trin i prøveudtagningsprocessen. Faktisk vil sådanne oplysninger være afgørende for at beregne upartiske estimater for befolkningen ved hjælp af prøveudtagningsvægte (det omvendte af sandsynligheden for udvælgelse) og under hensyntagen til prøveudtagningsdesignet for korrekt beregning af prøveudtagningsfejlen. I komplekse prøvedesign vil prøveudtagningsfejlen altid være større end i de enkle tilfældige prøver (Cochran 1977).
Når prøveudtagningsrammen indeholder enheder, der ikke længere eksisterer (f.eks. fordi prøveudtagningsrammerne er forkerte og forældede), vil det være umuligt at få prøver fra sådanne ikke eksisterende enheder. Denne situation påvirker ikke estimaterne, forudsat at sådanne tilfælde ikke erstattes ved hjælp af ikke-tilfældige metoder, og at de oprindelige prøveudtagningsvægte er korrekt justeret for at tage hensyn til sådanne ufuldkommenheder i prøverammen (ikke desto mindre har ufuldkommenheder i prøverammen klart omkostningsimplikationer, og hvis prøvestørrelsen reduceres, påvirker dette også størrelsen på prøveudtagningsfejlen).
løsninger på bias på grund af manglende respons er meget mere artikulerede og kan generelt opdeles i forudgående og efterfølgende løsninger (Groves et al. 1998). Forudgående løsninger forsøger at forhindre og minimere manglende respons på forskellige måder (for eksempel specifik træning af tællere, flere forsøg på at afhøre respondenten osv.) der henviser til, at efterfølgende løsninger forsøger at indsamle hjælpeoplysninger om ikke-respondenter, som derefter bruges til at beregne en sandsynlighed for respons for forskellige befolkningsundergrupper og således re-vægt responsdata for det inverse af en sådan sandsynlighed eller alternativt nogle post-stratificering og kalibrering.
Prøveudtagningsforstyrrelse, prøveudtagningsfejl, bias af sandsynlighedsfunktion og begrænset prøveudtagningsforstyrrelse
begrebet prøveudtagningsforstyrrelse bør ikke forveksles med andre relaterede, men forskellige begreber som “prøveudtagningsfejl”, “bias af en sandsynlighedsfunktionel” og “begrænset prøveudtagningsforstyrrelse”. Prøveudtagningsfejlen for en funktionel af sandsynlighedsfordelingen (såsom variansen eller entropien i fordelingen) er forskellen mellem estimatet af sandsynlighedsfunktionaliteten beregnet over den samplede fordeling og den korrekte værdi af den funktionelle beregnet over den sande fordeling. Bias af en funktionel af en sandsynlighedsfordeling er defineret som den forventede værdi af prøveudtagningsfejlen. Prøveudtagning bias kan føre til en bias af en sandsynlighed funktionel. De to begreber er imidlertid ikke ækvivalente.
en bias kan opstå, når man måler en ikke-lineær funktionel af sandsynlighederne fra et begrænset antal eksperimentelle prøver, selv når disse prøver virkelig vælges tilfældigt fra den underliggende population, og der således ikke er nogen prøveudtagningsforstyrrelse. Denne bias kaldes “begrænset prøveudtagningsforstyrrelse”. Vi vil nedenfor give et eksempel på den begrænsede prøveudtagningsforstyrrelse af gensidig information.
effekten af begrænset prøveudtagning på bestemmelsen af statistiske og årsagssammenhænge
\(\tag{1}I (H;Y) = \ sum_{H, y} P (H, y)\, log_2 \ frac{P(h,y)}{P(h) \cdot P(y)}\)
i praksis kan det imidlertid være vanskeligt at måle \(I(H;Y)\) fordi de nøjagtige værdier af sandsynlighederne \(P(H), P(y) og P (H, y)\) normalt er ukendte. Det kan i princippet være let at estimere disse sandsynligheder ud fra observerede frekvensfordelinger i eksperimentelle prøver, men dette fører normalt til partiske estimater af \(I(H;Y)\ ,\) selvom de prøver, der bruges til at estimere \(P(H), P(y) og P(H, y)\) selv er upartiske, repræsentative prøver af de underliggende fordelinger af \(H\) og \(Y\ .\) Denne særlige type bias kaldes “begrænset prøveudtagningsforstyrrelse” og defineres som forskellen mellem den forventede værdi af sandsynlighedsfunktionen beregnet ud fra sandsynlighedsfordelingerne estimeret med \(N\) prøver og dens værdi beregnet ud fra de sande sandsynlighedsfordelinger.
figur 2: den begrænsede prøveudtagning bias. Simulering af et” uinformativt ” system, hvis diskrete respons y er fordelt med en ensartet fordeling i området fra 1 til 10, uanset hvilken af to værdier af en formodet forklarende variabel H blev præsenteret. Eksempler på empiriske responssandsynlighedshistogrammer (røde faste linjer) udtaget fra 40 og 200 observationer (henholdsvis øverste og nederste række) vises i venstre og centrale kolonner (svar på hhv.1 og hhv. 2). Den sorte stiplede vandrette linje er den sande responsfordeling. Den højre kolonne viser (som blå histogrammer) fordelingen (over 5000 simuleringer) af de gensidige informationsværdier opnået med henholdsvis 40 (top) og 200 (bund) observationer. Efterhånden som antallet af observationer stiger, falder den begrænsede prøveudtagningsforstyrrelse. Den stiplede grønne lodrette linje i de højre kolonner angiver den sande værdi af den gensidige information, der bæres af det simulerede system (hvilket svarer til 0 bit).
som eksempel skal du overveje en hypotetisk responsvariabel \(Y\), der er ensartet fordelt i området 1-10, og en “forklarende variabel” \(H\), der kan antage værdier på enten 1 eller 2. Lad os antage, at disse i virkeligheden er helt uafhængige af hinanden, og at observere værdier af \(H\) ikke kan hjælpe med at forudsige sandsynlige værdier af \(y\ .\ ) En eksperimentalist, der søger efter mulige forhold mellem \(Y\) og \(Y\), ved imidlertid ikke dette. I dette tilfælde er den sande betingede sandsynlighed \(P(y|H)\) 0.1 (Figur 2a og figur 2b, sort prikket linje)for alle kombinationer af \(H\) og \(y\,\), hvilket betyder, at \(P(y)\) også er 0,1; følgelig er den sande værdi af den gensidige information null. Figur 2a og figur 2b viser eksperimentelle observationsfrekvenser (røde kurver) opnået fra et simuleret eksperiment med \(N\)= 40 prøver (20 prøver for hver værdi af \(H\)). I dette simulerede eksempel blev prøverne taget virkelig tilfældigt og korrekt fra de underliggende sandsynlighedsfordelinger, og der var således ingen prøveudtagningsforstyrrelse. På grund af begrænset prøveudtagning adskiller de estimerede sandsynligheder (rød linje i figur 2a og figur 2b) sig markant fra 0,1 og fra hinanden, og det gensidige informationsestimat opnået ved at tilslutte de eksperimentelt opnåede estimater til formlen ovenfor er ikke-null (0,2 bit). Gentagelse af det simulerede eksperiment igen og igen opnår man lidt forskellige resultater hver gang ( Figur 2C): informationsfordelingen beregnet ud fra \(N\)= 40 prøver er centreret ved 0,202 bit – og ikke ved den sande værdi af 0 bit. Dette viser, at det gensidige informationsestimat lider af begrænset prøveudtagningsforstyrrelse. Jo større antallet af prøver er, desto mindre er udsvingene i de estimerede sandsynligheder, og følgelig jo mindre er den begrænsede prøveudtagningsforstyrrelse. For eksempel med \(N\)= 200 prøver; (100 prøver for hver værdi af \(H\ ;\) figur 2D-F) er den begrænsede prøveudtagningsforstyrrelse af gensidig information 0,033 bit. Lignende problemer gælder også for målinger af årsagsforhold som Granger kausalitet og transfer entropi. Bemærk, at den begrænsede prøveudtagningsforstyrrelse opstår, fordi gensidig information er en ikke-lineær funktion af sandsynlighederne. Sandsynlighederne selv ville være upåvirket af begrænset prøveudtagningsforstyrrelse, fordi de ville gennemsnit til de sande sandsynligheder over mange gentagelser af eksperimentet med et endeligt antal data.begrænset prøveudtagningsforstyrrelse kan korrigeres ved at beregne dens tilnærmede værdi analytisk og trække den ud eller ved at bruge forudgående information om de underliggende sandsynlighedsfordelinger for at reducere deres statistiske prøveudtagningsfluktuationer. 2007).
Prøveudtagningsbias inden for neurovidenskab
i de senere år har der været stigende interesse for effekten af prøveudtagningsbias og af begrænset prøveudtagningsbias inden for neurovidenskab. Et vigtigt problem i sensorisk neurovidenskab er at forstå, hvordan netværk af neuroner repræsenterer og udveksler sensorisk information ved hjælp af deres koordinerede mønster af respons på stimuli. En meget anvendt empirisk tilgang til dette problem er at registrere ekstracellulært handlingspotentialerne udsendt af neuroner. Ekstracellulære elektroder placeres ofte på en valgt hjerneplacering, fordi handlingspotentialer kan detekteres. Det erkendes, at denne procedure kan påvirke prøveudtagningen mod større neuroner (udsender signaler, der er lettere at opdage) og mod de fleste aktive neuroner (Shoham et al. 2006). Dette er noget relateret til problemet med ‘convenience sampling’ diskuteret ovenfor. Neurovidenskabere er mere tilbøjelige til at rapportere adfærden hos de neuroner, der lettest (“bekvemt”) observeres med de metoder, de har til rådighed. Korrigering af denne prøveudtagningsforstyrrelse kræver også registrering fra mindre og mindre aktive neuroner og evaluering ved hjælp af forskellige typer anatomisk og funktionel information de relative fordelinger af forskellige typer neurale populationer. Konsekvenserne af dette prøveudtagningsproblem og måder at tage det i betragtning diskuteres i (Shoham et al. 2006). Den begrænsede prøveudtagningsforstyrrelse giver problemer i bestemmelsen af årsagsforholdet mellem sensoriske stimuli og visse træk ved de neuronale populationsresponser, fordi det kunstigt kan øge den gensidige information, der er tilgængelig i komplekse karakteriseringer af de neuronale reaktioner (såsom dem, der er baseret på de nøjagtige tidspunkter for handlingspotentialer) over den information, der er tilgængelig i enklere karakterisering af neuronal aktivitet (såsom dem, der forsømmer detaljerne i den tidsmæssige struktur af det neuronale respons). Konsekvenserne af dette prøveudtagningsproblem og måder at korrigere for det diskuteres i (panser et al. 2007).