Sampling bias

Post-publikasjon aktivitet

Kurator: Cesare Magri

Bidragsytere:
0.33 –

Ludovico Carraro

0.33 –

Eugene M. Izhikevich

0.33 –

Stefano Panzeri

0.17 –

nick orbeck

sampling bias betyr at prøvene av en stokastisk variabel som samles inn For Å Bestemme Fordelingen Er Valgt feil og representerer ikke den sanne fordelingen på grunn av ikke-tilfeldige årsaker. La oss vurdere et bestemt eksempel: vi vil kanskje forutsi utfallet av et presidentvalg ved hjelp av en meningsmåling. Å spørre 1000 velgere om deres stemmeintensjoner kan gi en ganske nøyaktig prediksjon av den sannsynlige vinneren, men bare hvis vårt utvalg av 1000 velgere er ‘representativt’ for velgerne som helhet (dvs.upartisk). Hvis vi bare avstemmer meningen fra 1000 hvite middelklassehøgskolestudenter, vil synspunktene til mange viktige deler av velgerne som helhet (etniske minoriteter, eldre mennesker, blåarbeidere) sannsynligvis være underrepresentert i utvalget, og vår evne til å forutsi utfallet av valget fra det utvalget reduseres.

i et upartisk utvalg skal forskjeller mellom prøvene tatt fra en tilfeldig variabel og dens sanne fordeling, eller forskjeller mellom prøvene av enheter fra en populasjon og hele populasjonen de representerer, bare skyldes tilfeldighet. Hvis forskjellene ikke bare skyldes sjanse, så er det en prøvetakingsforspenning. Utvalgsskjevhet oppstår ofte fordi visse verdier av variabelen er systematisk underrepresentert eller overrepresentert med hensyn til den sanne fordelingen av variabelen (som i vår meningsmåling eksempel ovenfor). På grunn av sin konsekvente natur fører prøvetakingsskjevhet til en systematisk forvrengning av estimatet av den samplede sannsynlighetsfordelingen. Denne forvrengningen kan ikke elimineres ved å øke antall dataprøver og må korrigeres for ved hjelp av passende teknikker, hvorav noen er omtalt nedenfor. Med andre ord vil avstemning av ytterligere 1000 hvite studenter ikke forbedre den prediktive kraften i vår meningsmåling, men avstemning av 1000 personer valgt tilfeldig fra valgrullen ville. Åpenbart kan en forutinntatt prøve forårsake problemer i mål på sannsynlighetsfunksjoner (f. eks., variansen eller entropien av fordelingen), siden noen statistikk beregnet fra den prøven har potensial til å være konsekvent feilaktig.

  • 1 Årsaker til sampling bias
  • 2 Korreksjon og reduksjon av sampling bias
  • 3 Sampling bias, sampling error, bias of probability function, and limited sampling bias
  • 4 effekten av begrenset sampling på bestemmelse av statistiske og årsakssammenheng
  • 5 Sampling bias in neuroscience
  • 6 referanser
  • 7 eksterne lenker
  • 8 se også

årsaker til sampling bias

en vanlig årsak Til sampling bias Ligger i utformingen av studien eller i datainnsamlingen prosedyre, som begge kan favorisere eller disfavor samle inn data fra bestemte klasser eller enkeltpersoner eller under visse forhold. Prøvetaking skjevhet er også spesielt fremtredende når forskere vedta prøvetaking strategier basert på dom eller bekvemmelighet, der kriteriet som brukes til å velge prøver er liksom knyttet til variabler av interesse. For eksempel, med henvisning til meningsmåling eksempel, en akademisk forsker samle opinionsdata kan velge, på grunn av bekvemmelighet, å samle meninger hovedsakelig fra studenter fordi de tilfeldigvis bor i nærheten, og dette vil ytterligere skjevhet prøvetaking mot mening utbredt i den sosiale klassen som bor i nabolaget.

Figur 1: Mulige kilder til skjevhet som forekommer i utvalget av et utvalg fra en populasjon.

i sosiale og økonomiske fag krever utvinning av tilfeldige prøver vanligvis en samplingsramme som listen over enhetene i hele befolkningen, eller noen tilleggsinformasjon om noen viktige egenskaper ved målpopulasjonen som skal samples. For eksempel, gjennomføre en studie om grunnskoler i et bestemt land krever å få en liste over alle skoler i landet, som en prøve kan trekkes ut. Bruk av en samplingsramme forhindrer imidlertid ikke nødvendigvis samplingsskjevhet. For eksempel kan man ikke riktig bestemme målpopulasjonen eller bruke utdatert og ufullstendig informasjon, og dermed utelukke deler av målpopulasjonen. Videre, selv når prøvetakingsrammen er valgt riktig, kan prøvetakingsskjevhet oppstå fra ikke-responsive prøvetakingsenheter (for eksempel kan enkelte klasser av fag være mer sannsynlig å nekte å delta, eller kan være vanskeligere å kontakte osv. Det er særlig sannsynlig at frafall vil føre til skjevheter når årsaken til frafall er relatert til fenomenet som studeres. Figur 1 illustrerer hvordan uoverensstemmelsene mellom utvalgsramme og målpopulasjon, samt frafall, kan forstyrre utvalget.i eksperimenter i fysiske og biologiske vitenskaper oppstår prøvetakingsforstyrrelser ofte når målvariabelen som skal måles under forsøket (f. eks. energien til et fysisk system) er korrelert med andre faktorer (f.eks. temperaturen i systemet) som holdes fast eller begrenset innenfor et kontrollert område under forsøket. Tenk for eksempel bestemmelsen av sannsynlighetsfordelingen av hastigheten til Alle biler På Britiske veier når som helst i løpet av en bestemt dag. Hastighet er definitivt relatert til plassering: derfor måle hastighet bare på visse typer steder kan skjevhet prøven. For eksempel, hvis alle tiltak blir tatt på travle trafikknutepunkter i sentrum av byen, vil samplet fordeling av bilhastigheter ikke være representativ For Storbritannias biler og vil være sterkt partisk mot lave hastigheter, fordi det forsømmer biler som reiser på motorveier og på andre raske veier. Det er viktig å merke seg at en systematisk forvrengning av en utvalgsfordeling av en tilfeldig variabel også kan skyldes andre faktorer enn utvalgsskjevhet, for eksempel en systematisk feil i instrumentene som brukes til å samle utvalgsdataene. Vurderer igjen eksempel på fordelingen av hastigheten på biler I Storbritannia, og anta at eksperimentator har tilgang til samtidig lesing av hastighetsmålere plassert på hver bil, slik at det ikke er noen prøvetaking bias. Hvis de fleste hastighetsmålere er innstilt for å overvurdere hastigheten, og for å overvurdere den mer ved høyere hastighet, vil den resulterende samplede fordelingen være forspent mot høye hastigheter.

Korreksjon og reduksjon av prøvetakingsskjevhet

For å redusere prøvetakingsskjevhet er de to viktigste trinnene ved utforming av en studie eller et eksperiment (i) for å unngå vurderings-eller bekvemmelighetsprøvetaking (ii) for å sikre at målpopulasjonen er riktig definert og at utvalgsrammen samsvarer med den så mye som mulig. Når begrensede ressurser eller effektivitetshensyn begrenser muligheten til å ta prøver av hele populasjonen, bør det tas hensyn til at de ekskluderte populasjonene ikke skiller seg fra den samlede populasjonen når det gjelder statistikken som skal måles. I samfunnsvitenskapelige befolkningsrepresentative undersøkelser er det oftest ikke enkle tilfeldige prøver, men følger mer komplekse utvalgsdesign (Cochran 1977). For eksempel, i en typisk husholdning undersøkelse et utvalg av husholdninger er valgt i to trinn: i en første fase er det et utvalg av landsbyer eller deler av byer (klynge), og i en annen fase velges et bestemt antall husholdninger innenfor samme klynge. Ved bruk av slike komplekse prøveutforminger er det viktig å sikre at utvalgsrammeinformasjonen brukes riktig, og at sannsynligheten og tilfeldig utvalg implementeres og dokumenteres i hvert trinn i prøvetakingsprosessen. Faktisk vil slik informasjon være avgjørende for å beregne objektive estimater for befolkningen ved hjelp av prøvetakingsvekter (den inverse av sannsynligheten for utvelgelse) og ta hensyn til prøvetakingsdesignet for å kunne beregne prøvetakingsfeilen riktig. I komplekse prøveutforminger vil prøvetakingsfeilen alltid være større enn i de enkle tilfeldige prøvene (Cochran 1977).

Når samplingsrammen inneholder enheter som ikke eksisterer lenger (f. eks. fordi samplingsrammene er feil og utdaterte), vil det være umulig å få noen prøver fra slike ikke-eksisterende enheter. Denne situasjonen forstyrrer ikke estimatene, forutsatt at slike tilfeller ikke erstattes ved hjelp av ikke-tilfeldige metoder, og at originale prøvetakingsvekter er riktig justert for å ta hensyn til slike prøverammefeil (likevel har prøverammefeil klart kostnadsimplikasjoner, og hvis prøvestørrelsen reduseres, påvirker dette også størrelsen på prøvetakingsfeilen).Løsninger på bias på grunn av frafall er mye mer artikulert, og kan generelt deles i ex-ante og ex-post løsninger (Groves et al. 1998). Ex-ante løsninger prøver å forhindre og minimere frafall på ulike måter (for eksempel spesifikk opplæring av enumerators, flere forsøk på å intervjue respondenten, etc.) mens ex-post-løsninger forsøker å samle tilleggsinformasjon om ikke-respondenter som deretter brukes til å beregne en sannsynlighet for respons for forskjellige populasjonsundergrupper og så vektere responsdata for invers av slik sannsynlighet eller alternativt noen post-stratifisering og kalibrering.

Samplingsskjevhet, samplingsfeil, bias av sannsynlighetsfunksjon og begrenset samplingsskjevhet

begrepet samplingsskjevhet må ikke forveksles med andre relaterte, men distinkte begreper som» samplingsfeil»,» bias av en sannsynlighetsfunksjonell «og»begrenset samplingsskjevhet». Utvalgsfeilen til en funksjon av sannsynlighetsfordelingen (for eksempel variansen eller entropien til fordelingen) er forskjellen mellom estimatet av sannsynlighetsfordelingen beregnet over den samplede fordelingen og den korrekte verdien av den funksjonelle beregnet over den sanne fordelingen. Bias av en funksjon av en sannsynlighetsfordeling er definert som forventet verdi av utvalgsfeilen. Sampling bias kan føre til en bias av en sannsynlighet funksjonell. Imidlertid er de to konseptene ikke likeverdige. en skjevhet kan oppstå ved måling av en ikke-lineær funksjon av sannsynlighetene fra et begrenset antall eksperimentelle prøver, selv når disse prøvene virkelig er tilfeldig plukket fra den underliggende populasjonen, og det er dermed ingen prøvetakingsskjevhet. Denne bias kalles «begrenset prøvetaking bias». Vi vil gi nedenfor et eksempel på den begrensede prøvetakingsskjevheten av gjensidig informasjon.

effekten av begrenset prøvetaking på bestemmelse av statistiske og årsakssammenheng

\(\tag{1}I (X;Y) = \sum_{x,y} p(x,y) \, log_2 \frac{p(x,y)}{p(x) \cdot P(y)}\)

I praksis kan det imidlertid være vanskelig å måle \(I(x;Y)\) fordi de nøyaktige verdiene av sannsynlighetene \(P(x), P(y) og p(x, y)\) vanligvis er ukjente. Det kan være enkelt i prinsippet å estimere disse sannsynlighetene fra observerte frekvensfordelinger i eksperimentelle prøver, men dette fører vanligvis til partiske estimater av \(I (x; Y)\ ,\) selv om prøvene som brukes til å estimere \(P(x), P(y) og p(x,y)\) er selv objektive, representative prøver av de underliggende fordelingene av \(X\) Og \(Y\).\ ) Denne spesielle typen skjevhet kalles «begrenset utvalgsskjevhet», og er definert som forskjellen mellom den forventede verdien av sannsynlighetsfunksjonen beregnet fra sannsynlighetsfordelingene estimert med \(N\) prøver, og dens verdi beregnet fra de sanne sannsynlighetsfordelingene.

Figur 2: den begrensede prøvetakingsskjevheten. Simulering av et» uinformativt » system hvis diskrete respons y er fordelt med en jevn fordeling fra 1 til 10, uavhengig av hvilken av to verdier av en formodentlig forklaringsvariabel x ble presentert. Eksempler på empiriske responssannsynlighetshistogrammer (røde faste linjer) samplet fra 40 og 200 observasjoner (henholdsvis øverste og nederste rad) vises i Venstre og Sentrale kolonner (svar på henholdsvis x = 1 og x = 2). Den svarte stiplede horisontale linjen er den sanne responsfordelingen. Den høyre kolonnen viser (som blå histogrammer) fordelingen (over 5000 simuleringer) av de gjensidige informasjonsverdiene oppnådd med henholdsvis 40 (topp) og 200 (bunn) observasjoner. Etter hvert som antall observasjoner øker, reduseres den begrensede prøvetakingsskjevheten. Den stiplede grønne vertikale linjen i de Høyre kolonnene indikerer den sanne verdien av den gjensidige informasjonen som bæres av det simulerte systemet (som tilsvarer 0 biter).

for eksempel, vurder en hypotetisk responsvariabel \(Y\) som er jevnt fordelt i området 1-10, og en «forklarende variabel» \(X\) som kan anta verdier av enten 1 eller 2. La oss anta at disse i virkeligheten er helt uavhengige av hverandre, og derfor observere verdier av \(x\) kan ikke bidra til å forutsi sannsynlige verdier av \(y\ .En eksperimentalist som søker etter mulige forhold mellom \ (X\) og\ (Y\) vet imidlertid ikke dette. I dette tilfellet er den sanne betingede sannsynligheten \(P (y / x)\) 0.1 (Figur 2a OG Figur 2b, svart prikket linje) for alle kombinasjoner av \(x\) og \ (y\,\) som betyr at \(P (y)\) også er 0,1; følgelig er den sanne verdien av gjensidig informasjon null. Figur 2A og Figur 2b viser eksperimentelle observasjonsfrekvenser (røde kurver) oppnådd fra et simulert eksperiment med \(N\)= 40 prøver (20 prøver for hver verdi av \(x\)). I dette simulerte eksemplet ble prøvene tatt helt tilfeldig og riktig fra de underliggende sannsynlighetsfordelingene, og dermed var det ingen prøvetakingsskjevhet. På grunn av begrenset prøvetaking varierer imidlertid de estimerte sannsynlighetene (rød linje I Figur 2a og FIGUR 2b) markant fra 0,1 og fra hverandre, og det gjensidige informasjonsestimatet som oppnås ved å plugge de eksperimentelt oppnådde estimatene inn i formelen ovenfor, er ikke null (0,2 bits). Ved å gjenta det simulerte eksperimentet om og om igjen, får man litt forskjellige resultater hver Gang ( Figur 2c): informasjonsfordelingen beregnet fra \(N\)= 40 prøver er sentrert på 0,202 biter – og ikke ved den sanne verdien av 0 biter. Dette viser at gjensidig informasjon estimat lider av begrenset prøvetaking skjevhet. Jo større antall prøver, jo mindre svingninger i estimerte sannsynligheter, og dermed mindre begrenset prøvetaking bias. For eksempel, med \(N\) = 200 prøver; (100 prøver for hver verdi av \(x\ ;\) Figur 2D-F), er den begrensede prøvetakingsskjevheten av gjensidig informasjon 0,033 biter. Lignende problemer gjelder også for tiltak av årsakssammenheng som Granger kausalitet og overføring entropi. Merk at den begrensede prøvetakingsskjevheten oppstår fordi gjensidig informasjon er en ikke-lineær funksjon av sannsynlighetene. Sannsynlighetene selv ville være upåvirket av begrenset prøvetakingsskjevhet, fordi de ville gjennomsnitt til de sanne sannsynlighetene over mange gjentakelser av forsøket med et begrenset antall data.Begrenset prøvetakingsskjevhet kan korrigeres ved å beregne den omtrentlige verdien analytisk og trekke den ut, eller ved å bruke tidligere informasjon om de underliggende sannsynlighetsfordelingene for å redusere deres statistiske prøvetakingsfluktuasjoner (Panzeri et al. 2007).

Sampling bias i nevrovitenskap

De siste årene har det vært økende interesse for effekten av sampling bias og av begrenset sampling bias i nevrovitenskap. Et viktig problem i sensorisk nevrovitenskap er å forstå hvordan nettverk av nevroner representerer og utveksler sensorisk informasjon ved hjelp av deres koordinerte mønster av respons på stimuli. En mye brukt empirisk tilnærming til dette problemet er å registrere ekstracellulært handlingspotensialene utgitt av nevroner. Ekstracellulære elektroder plasseres ofte i en hjerneplassering valgt fordi handlingspotensialer kan detekteres. Det er anerkjent at denne prosedyren kan forstyrre prøvetaking mot større nevroner (emitterende signaler som er lettere å oppdage) og mot de fleste aktive nevroner (Shoham et al. 2006). Dette er noe relatert til problemet med ‘convenience sampling’ diskutert ovenfor. Neuroscientists er mer sannsynlig å rapportere oppførselen til de nevronene som er lettest («beleilig») observert med metodene til deres disposisjon. Korrigering av denne prøvetakingsskjevheten krever også opptak fra mindre og mindre aktive nevroner og evaluering, ved hjelp av ulike typer anatomisk og funksjonell informasjon, de relative fordelingene av forskjellige typer nevrale populasjoner. Implikasjonene av dette samplingsproblemet og måter å ta det i betraktning er diskutert i (Shoham et al. 2006). Den begrensede prøvetaking skjevhet gir problemer i fastsettelse av årsakssammenheng mellom sensoriske stimuli og visse funksjoner i nevronpopulasjonen responser, fordi det kan kunstig øke gjensidig informasjon tilgjengelig i komplekse karakteriseringer av nevronresponser (slik som de som er basert på de nøyaktige tider av aksjonspotensialer) over informasjonen som er tilgjengelig i enklere karakterisering av nevronaktiviteten (slik som de som forsømmer detaljene i den tidsmessige strukturen i nevronresponsen). Implikasjonene av dette samplingsproblemet og måter å korrigere for det er diskutert i (Panzeri et al. 2007).

Related Posts

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *