74

ett nytt skolår är i full kraft, så skolorna börjar tänka på om eleverna är på rätt väg för att uppfylla deras stats akademiska standarder. De är också sannolikt att tänka framåt om statliga prestationstester, de oberoende och objektiva tentor eleverna tar för att avgöra om de lär sig på lämplig betygsnivå.

samtidigt kanske vissa föräldrar undrar om de ska välja sitt barn ur dessa tester. Som en individuell handling är att välja bort tester som att välja bort årliga medicinska kontroller – Det ger ingen information och gör inte en friskare. Som en kollektiv handling, väljer ut urholkar vad som kan läras av testresultat. Om föräldrar till högpresterande elever i en skola alla väljer bort, kommer skolans genomsnittliga poäng att vara lägre (och vice versa för lågpresterande studenter). Vem som får hjälp är oklart.

vilka provtest återspeglar vilka stater som vill att deras elever ska lära sig-standarderna. Att jämföra genomsnittliga poäng mellan skolor och distrikt är endast möjligt eftersom samma test görs. Vid mätning av vad eleverna vet är tester en enorm tillgång som ger viktig och tillförlitlig information som inte kan läras på andra sätt.

För att vara säker, inte många människor ser fram emot att ta tester. Men när vi tittar på vår doktors vägg och ser en plack som hon är styrelsecertifierad, kanske vi tycker att certifiering är bra. Läkaren passerade ett test. Eller en advokat kan bli antagen till baren, vilket betyder att han har klarat Statens barprov — ett test. En auktoriserad revisor kommer att ha klarat ett batteri av tester. Ingen vill ha en läkare, advokat eller revisor vars kunskap ligger under den accepterade standarden.

detsamma borde vara sant i skolorna. Så det är användbart att ta ett steg tillbaka och ställa en viktig fråga: återspeglar testresultatet vad ett barn vet? I så fall gör den vad den är avsedd att göra. Examenspoäng är ofta hånade som resultatet av” undervisning på provet”, men vad människor som använder den frasen verkligen klagar på är rote och livlös undervisning. Livlös undervisning och undervisning på provet är två olika saker. Verklig undervisning till testet är centralt för effektiv undervisning, så länge tentorna återspeglar vad eleverna ska lära sig.

hur tester skapas

för föräldrar som inte är lärare kan processen att skapa standardiserade tester verka som en stor svart låda. Det är faktiskt en rigorös och mycket vetenskaplig process, en som har utvecklats under 100 år och återspeglar forskning av generationer av uppskattade forskare. Den har sitt eget underfält, psykometri, och varje år utbildar universitet ny doktorsexamen.s i det underfältet.

Vi kan tänka på storskalig testutveckling genom att först tänka på testutveckling i miniatyr. Tänk på hur en gymnasielärare kan utforma ett test relaterat till exempelvis linjära ekvationer i algebra.

läraren levererade en viss mängd material om ämnet i form av klassrumsinstruktion, läxor och andra uppdrag som gruppaktiviteter eller online-lektioner. Avgörande, vad läraren lärde bör relatera till en uppsättning innehållsstandarder som varje stat har utvecklat och vanligtvis publicerar online.

här är en algebrastandard från Common Core: Lös linjära ekvationer och ojämlikheter i en variabel, inklusive ekvationer med koefficienter representerade av bokstäver. (Intresserade läsare kan se andra standarder för algebra här och kan hitta alla standarder här.)

till en lärare indikerar denna standard att hennes elever ska kunna göra detta: för ekvationen 3x + 4 = 13, bestäm att x är lika med 3. Eller, om ekvationen är ax + b = c, kunna lösa för x lika (c-b)/A. i denna andra ekvation representeras koefficienter som bokstäver, som standarden kräver.

för läraren som vill veta om hennes elever uppfyller standarden kanske hon tycker att en rimlig fråga är att be dem att lösa 15y + 10 = 40. Testfrågan innehåller en subtil skillnad-eleverna behöver lösa för y snarare än x — men det är fortfarande en ekvation med en enda variabel. Läraren kan höja svårighetsgraden lite genom att be eleverna att lösa y + 3y + 10 = 50. Eleverna måste lägga till de två Y-termerna, men det är fortfarande en ekvation med en enda variabel.

dessa svåra frågor måste vara där

om testet innehåller för många svåra frågor, och inga studenter får några svar rätt, har provet vad testdesigners kallar ett golv. Med alla elever poäng 0, läraren kan inte skilja vad hennes elever vet: golvet blockerar läraren från att veta vilka elever som har en låg kunskapsnivå och som har en hög nivå.

På samma sätt, om läraren gör testet så enkelt att många elever får alla svar rätt, kommer hon att ha skapat en takeffekt. Vissa elever har sanna förmågor över sina poäng, men taket blockerar läraren från att veta det, för när alla testresultat är 100 procent ser alla elever likadana ut.

för att undvika tak-och golveffekter behöver tester frågor med högre och lägre svårighetsgrader. Studenter med stark kunskap kan svara på de hårdare frågorna; studenter med svagare kunskap är det inte.

samma utvecklingsprocess används i mycket större skala för bedömningar som PARCC-testet (förkortningen står för Partnership for Assessment of Readiness for College and Careers), Smarter Balanced och Texas STAAR test, State of Texas Assessment of Academic Readiness. Här är standarderna utgångspunkten för utformningen av testerna (här är en visualisering av processen).

utbildare och testexperter utvecklar banker med frågor relaterade till dessa standarder, såsom algebrafrågorna ovan. Dessa granskas för att säkerställa att de testar vad standarderna kräver och att deras formulering är tydlig och inte olämplig eller partisk mot någon ras eller kön.

till exempel kan en matematisk fråga som innebär att beräkna en basebollspelares slagmedelvärde utgöra ett problem för studenter som inte spelar baseball eller inte känner till sina regler. Att revidera formuleringen för att handla om att beräkna ett enkelt genomsnitt utan att referera till baseball kan vara lösningen, som helt enkelt kan ersätta en annan fråga.

noggranna ansträngningar investeras i dessa tester. Varje fråga på PARCC tentor, till exempel, granskas av 30 eller fler personer innan den används. Frågor som gör nedskärningen testas sedan i 14 stater och nästan 16 000 skolor. Smarter Balanced följer en liknande process och testar mer än 5 000 artiklar i 21 stater och mer än 5 000 skolor.

på vilken klassnivå som helst kommer testet sannolikt att innehålla åtminstone några riktigt svåra frågor som kan verka långt bortom elevernas förmågor i den klassen. Studenter (och lärare) tenderar att komma ihåg dessa typer av frågor, men de är inte på provet bara för att skapa smärta och obehag. Snarare undviker sådd av testet med svåra frågor takeffekten och hjälper till att skilja mellan studenter som har en grundläggande kompetensnivå och de på avancerad nivå. Det kan fortfarande finnas studenter som får alla frågor fel eller rätt, men utformningen av testerna gör det osannolikt att det händer.

vissa klagomål är förtjänade, vissa är inte

vissa aspekter av tester förtjänar klagomål. Till exempel är test-poängrapporter till föräldrar ofta lastade med statistisk jargong som normer, percentiler, normala kurvaekvivalenter, staniner, lexiler och kompetensnivåer som är baserade på … vem vet vad.

en förälder vars barn poäng på 65: e percentilen i fjärde klass och 65: e percentilen i femte klass kanske undrar om han eller hon står stilla. Barnet är inte-faktiskt, studenten har lärt sig ett års värde av material, eftersom barnet gjorde bättre än 65 procent av fjärde klassare och sedan, ett år senare, bättre än 65 procent av femte klassare. Men testdesigners har gjort sig inga favörer genom att tillhandahålla rapporter som kräver att föräldrar brottas med statistiska begrepp för att få mening om poäng.

Vissa föräldrar kan se ett barns testresultat och tycker att det måste vara fel eftersom de vet att deras barn är bättre på matematik (eller läsning eller vetenskap) än det. Kanske hade studenten en ledig dag-sjukdom, familjedistraktion, en hoppad frukost. Föräldrar bör se poäng mot bakgrund av andra indikatorer på hur deras barn mår i skolan, till exempel betyg på rapportkort.

föräldrar kan också vara oroliga för att deras barns testresultat används som grund för att utvärdera sitt barns lärare, en utveckling under det senaste decenniet som uppstod som svar på press på stater och skoldistrikt för att höja testresultat. Kommer inte deras barns lärare bryr sig mer om poängen än om deras barn?

Tja, nej-de flesta system för betygslärare ger bara en måttlig vikt till poäng, medan organisering och hantering av klassrum får mer vikt. Och tanken att lärare som bryr sig om högre poäng är en dålig sak återspeglar en topsy-turvy syn på utbildning, där lärare uppnår sina mål — att få sina elever att lära sig vad som finns i standarderna — är på något sätt ett problem.

vissa debatter om tester bygger på en tunn grund. Till exempel tar årliga statliga tester inte mycket instruktionstid. Föräldrar kan vara oroliga för att deras barns lärare undervisar på provet, men som beskrivits ovan är tester utformade för att mäta kunskap om samma standarder som läroplanerna i klassrummet bygger på.

så, när detta skolår utvecklas, låt oss komma ihåg varför stater testar studenter: för att se om de lär sig på lämplig betygsnivå. Och låt oss förstå att tester skapas genom en tillförlitlig process, ungefär som de tentor som våra läkare, advokater och revisorer måste ta.

Mark Dynarski, grundare och president för Pemberton Research, är en utbildning fellow vid George W. Bush Institute.

skicka ett brev till redaktören

Related Posts

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *