Et nytt skoleår er i full kraft, så skolene begynner å tenke på om elevene er på vei til å møte statens faglige standarder. De er også sannsynlig å tenke fremover om statlige prestasjonstester, de uavhengige og objektive eksamenene studentene tar for å avgjøre om de lærer på riktig klassetrinn.samtidig kan noen foreldre lure på om de bør velge sitt barn ut av disse testene. Som en individuell handling er det å velge bort tester som å velge bort årlige medisinske kontroller-det gir ingen informasjon og gjør ikke en sunnere. Som en kollektiv handling eroderer det å velge ut det som kan læres av testresultater. Hvis foreldre til høypresterende studenter i en skole alle velger bort, vil skolens gjennomsnittlige poengsum bli lavere (og omvendt for lavpresterende studenter). Hvem som får hjelp er uklart.
hvilke eksamener test gjenspeiler hva stater vil at elevene skal lære-standardene. Sammenligning av gjennomsnittlig score mellom skoler og distrikter er bare mulig fordi den samme testen er gjort. Ved å måle hva elevene vet, er tester en enorm ressurs, og gir viktig og pålitelig informasjon som ikke kan læres på andre måter.
for å være sikker, ser ikke mange frem til å ta tester. Men når vi ser på legen vår veggen og se en plakett som hun er styret-sertifisert, vi tror kanskje sertifisering er en god ting. Legen bestod en test. Eller en advokat kan bli tatt opp i baren, noe som betyr at han har bestått statens bareksamen – en test. En statsautorisert revisor vil ha bestått et batteri av tester. Ingen ønsker en lege, advokat eller regnskapsfører hvis kunnskap er under den aksepterte standarden.
det samme bør være sant i skolene. Så det er nyttig å ta et skritt tilbake og stille et viktig spørsmål: gjenspeiler testpoenget hva et barn vet? I så fall gjør den det den er designet for å gjøre. Eksamen score er ofte latterliggjort som et resultat av «undervisning på prøve,» men hva folk som bruker det uttrykket er virkelig klager om er rote og livløs undervisning. Livløs undervisning og undervisning på prøve er to forskjellige ting. Real undervisning på prøve er sentralt for effektiv undervisning, så lenge eksamenene gjenspeiler hva elevene skal lære.
hvordan tester opprettes
til foreldre som ikke er lærere, kan prosessen med å lage standardiserte tester virke som en stor svart boks. Faktisk er det en streng og høyt vitenskapelig prosess, en som har blitt utviklet over 100 år og reflekterer forskning av generasjoner av respekterte lærde. Den har sin egen delfelt, psykometri, og hvert år universiteter oppgradere ny Ph. D.s i det underfeltet.
vi kan tenke på storskala testutvikling ved først å tenke på testutvikling i miniatyr. Vurder hvordan en videregående lærer kan gå om å designe en test relatert til, si, lineære ligninger i algebra.
læreren leverte en viss mengde materiale om emnet i form av klasseromsundervisning, lekser og andre oppgaver som gruppeaktiviteter eller online leksjoner. Avgjørende, hva læreren lærte bør forholde seg til et sett av innhold standarder som hver stat har utviklet og vanligvis innlegg på nettet.Her Er en algebra standard Fra Common Core: Løs lineære ligninger og ulikheter i en variabel, inkludert ligninger med koeffisienter representert ved bokstaver. (Interesserte lesere kan se andre standarder for algebra her og kan finne alle standardene her.)
til en lærer indikerer denne standarden at elevene skal kunne gjøre dette: for ligningen 3x + 4 = 13, bestem at x er lik 3. Eller, hvis ligningen er ax + b = c, kunne løse for x er lik (c-b – / a. i denne andre ligningen er koeffisientene representert som bokstaver, som standarden krever.
for læreren som ønsker å vite om elevene oppfyller standarden, kan hun tenke at et rimelig spørsmål er å be dem om å løse 15y + 10 = 40. Testspørsmålet inneholder en subtil forskjell — studentene må løse for y i stedet for x — men det er fortsatt en ligning med en enkelt variabel. Læreren kan opp vanskelighetsnivået litt ved å be elevene om å løse y + 3y + 10 = 50. Studentene må legge til de to y-termene, men det er fortsatt en ligning med en enkelt variabel.
de vanskelige spørsmålene må være der
hvis testen inneholder for mange vanskelige spørsmål, og ingen studenter får noen svar riktig, har eksamenen hva testdesignere kaller et gulv. Med alle studenter som scorer 0, kan læreren ikke skille hva elevene vet: gulvet blokkerer læreren fra å vite hvilke studenter som har lavt kunnskapsnivå og som har høyt nivå.
På Samme måte, hvis læreren gjør testen så enkel at mange studenter får alle svarene riktig, vil hun ha skapt en takeffekt. Noen studenter har sanne evner over sin poengsum, men taket blokkerer læreren fra å vite det fordi når alle testresultatene er 100 prosent, ser alle elevene det samme ut.for å unngå tak-og gulveffekter trenger tester spørsmål med høyere og lavere vanskelighetsgrader. Studenter med sterk kunnskap er i stand til å svare på de vanskeligere spørsmålene; studenter med svakere kunnskap er ikke.den samme utviklingsprosessen brukes i mye større skala for vurderinger som PARCC-testen (akronymet står For Partnerskapet for Vurdering Av Beredskap For Høyskole Og Karriere), Smartere Balansert Og Texas STAAR-testen, State Of Texas Assessment Of Academic Readiness. Her er standardene utgangspunktet for å designe testene (her er en visualisering av prosessen).
Lærere og testeksperter utvikler banker med spørsmål knyttet til disse standardene, for eksempel algebra spørsmålene ovenfor. Disse blir gransket for å sikre at de tester hva standardene krever, og at deres ordlyd er klar og ikke upassende eller partisk mot rase eller kjønn.for eksempel kan et mattespørsmål som innebærer å beregne en baseballspillers batting-gjennomsnitt, utgjøre et problem for studenter som ikke spiller baseball eller ikke er kjent med reglene. Revidere ordlyden å være om å beregne en enkel gjennomsnitt uten å referere baseball kan være løsningen, som kan bare erstatte et annet spørsmål.
Omhyggelig innsats er investert i disse testene. Hvert spørsmål PÅ PARCC eksamener, for eksempel, er anmeldt av 30 eller flere personer før den brukes. Spørsmål som gjør kuttet blir deretter pilot-testet i 14 stater og nesten 16.000 skoler. Smarter Balanced følger en lignende prosess, og tester mer enn 5000 elementer i 21 stater og mer enn 5000 skoler.
på et hvilket som helst klassetrinn vil testen sannsynligvis inkludere minst noen virkelig vanskelige spørsmål som kan virke langt utover evnen til elevene i den karakteren. Studenter (og lærere) har en tendens til å huske slike spørsmål, men de er ikke på prøve bare for å skape smerte og ubehag. Snarere unngår å se testen med vanskelige spørsmål takeffekten og bidrar til å skille mellom studenter som har et grunnleggende ferdighetsnivå og de på avansert nivå. Det kan fortsatt være studenter som får alle spørsmålene feil eller riktig, men utformingen av testene gjør det lite sannsynlig å skje.
noen klager er fortjent, noen er ikke
Noen aspekter av tester trekker fortjent klager. For eksempel, test-score rapporter til foreldre ofte er lastet med statistisk sjargong som normer, persentiler, normal kurve ekvivalenter, stanines, lexiles, og ferdighetsnivåer som er basert på … hvem vet hva.en forelder hvis barn scorer på 65-prosentilen i fjerde klasse og 65-prosentilen i femte klasse, kan lure på om han eller hun står stille. Barnet er ikke-faktisk har studenten lært et års verdi av materiale, fordi barnet scoret bedre enn 65 prosent av fjerde gradere og deretter et år senere, bedre enn 65 prosent av femte gradere. Men testdesignere har ikke gjort seg selv favoriserer ved å gi rapporter som krever at foreldrene griper med statistiske begreper for å få mening om poeng.Noen foreldre kan se et barns testresultat og tror det må være feil fordi de vet at barnet deres er bedre i matte (eller lesing eller vitenskap) enn det. Kanskje studenten hadde en off day-sykdom, familie distraksjon, en hoppet over frokost. Foreldre bør se score på bakgrunn av andre indikatorer på hvordan deres barn gjør på skolen, for eksempel karakterer på rapportkort.Foreldre kan også være bekymret for at deres barns testresultater brukes som grunnlag for å evaluere barnets lærer, en utvikling i det siste tiåret som dukket opp som svar på press på stater og skolekretser for å øke testresultater. Vil ikke deres barns lærer bryr seg mer om poengsummen enn om deres barn?
vel, nei-de fleste systemer for vurdering lærere gir bare en moderat vekt til score, mens organisere og administrere klasserom få mer vekt. Og tanken om at lærere bryr seg om høyere score er en dårlig ting, gjenspeiler en kaotiske syn på utdanning, der lærere oppnår sine mål-å få elevene til å lære hva som er i standardene – er på en eller annen måte et problem.
noen debatter om tester er bygget på en spinkel basis. For eksempel tar årlige statlige tester ikke mye undervisningstid. Foreldre kan være bekymret for at deres barns lærer underviser på prøve, men, som beskrevet ovenfor, tester er utformet for å måle kunnskap om de samme standardene som klasserommet læreplaner er basert.
Så, som dette skoleåret utfolder seg, la oss huske hvorfor stater test studenter: for å se om de lærer på riktig klassetrinn. Og la oss forstå at tester er opprettet gjennom en pålitelig prosess, mye som eksamener våre leger, advokater og regnskapsførere må ta.Mark Dynarski, grunnlegger Og president For Pemberton Research, er en utdanningsstipendiat Ved George W. Bush Institute.
Send Inn Et Brev Til Redaktøren