Ein neues Schuljahr ist in vollem Gange, und die Schulen beginnen darüber nachzudenken, ob die Schüler auf dem richtigen Weg sind, um die akademischen Standards ihres Staates zu erfüllen. Sie denken wahrscheinlich auch über staatliche Leistungstests nach, die unabhängigen und objektiven Prüfungen, die Schüler ablegen, um festzustellen, ob sie auf der entsprechenden Klassenstufe lernen.
Zur gleichen Zeit könnten sich einige Eltern fragen, ob sie ihr Kind aus diesen Tests herausnehmen sollten. Als individuelle Handlung ist die Ablehnung von Tests wie die Ablehnung jährlicher medizinischer Untersuchungen – sie liefert keine Informationen und macht nicht gesünder. Als kollektiver Akt untergräbt das Opting-Out, was aus Testergebnissen gelernt werden kann. Wenn sich Eltern von leistungsschwachen Schülern in einer Schule alle abmelden, ist die durchschnittliche Punktzahl dieser Schule niedriger (und umgekehrt für leistungsschwache Schüler). Wem geholfen wird, ist unklar.
Welcher Prüfungstest spiegelt wider, was Staaten von ihren Schülern lernen wollen – die Standards. Der Vergleich der Durchschnittswerte zwischen Schulen und Bezirken ist nur möglich, weil derselbe Test durchgeführt wird. Bei der Messung dessen, was die Schüler wissen, sind Tests ein enormer Vorteil und liefern wichtige und zuverlässige Informationen, die auf andere Weise nicht erlernt werden können.
Natürlich freuen sich nicht viele Leute darauf, Tests zu machen. Aber wenn wir auf die Wand unseres Arztes schauen und eine Plakette sehen, dass sie Board-zertifiziert ist, Wir könnten denken, Zertifizierung ist eine gute Sache. Der Arzt hat einen Test bestanden. Oder ein Anwalt könnte in die Anwaltskammer aufgenommen werden, was bedeutet, dass er die Anwaltsprüfung des Staates bestanden hat — einen Test. Ein Wirtschaftsprüfer hat eine Reihe von Tests bestanden. Niemand will einen Arzt, Anwalt oder Buchhalter, dessen Wissen unter dem akzeptierten Standard liegt.
Das gleiche gilt für Schulen. Es ist also nützlich, einen Schritt zurückzutreten und eine wichtige Frage zu stellen: Spiegelt das Testergebnis wider, was ein Kind weiß? Wenn ja, tut es, was es tun soll. Prüfungsergebnisse werden oft als das Ergebnis von „Lehren zum Test“ verspottet, aber worüber sich Leute, die diesen Ausdruck verwenden, wirklich beschweren, ist roter und lebloser Unterricht. Lebloses Lehren und Lehren auf die Probe sind zwei verschiedene Dinge. Echter Unterricht zum Test ist von zentraler Bedeutung für einen effektiven Unterricht, solange die Prüfungen widerspiegeln, was die Schüler lernen sollen.
Wie Tests erstellt werden
Für Eltern, die keine Pädagogen sind, mag der Prozess der Erstellung standardisierter Tests wie eine große Blackbox erscheinen. Tatsächlich ist es ein rigoroser und hochwissenschaftlicher Prozess, der über 100 Jahre entwickelt wurde und die Forschung von Generationen angesehener Wissenschaftler widerspiegelt. Es hat sein eigenes Unterfeld, Psychometrie, und jedes Jahr absolvieren Universitäten neue Ph.D.s in diesem Unterfeld.
Wir können über die Testentwicklung in großem Maßstab nachdenken, indem wir zuerst über die Testentwicklung in Miniatur nachdenken. Überlegen Sie, wie ein Gymnasiallehrer einen Test entwerfen könnte, der sich beispielsweise auf lineare Gleichungen in der Algebra bezieht.
Der Lehrer lieferte eine bestimmte Menge an Material zu diesem Thema in Form von Unterricht, Hausaufgaben und anderen Aufgaben wie Gruppenaktivitäten oder Online-Unterricht. Entscheidend ist, dass sich das, was der Lehrer unterrichtet, auf eine Reihe von Inhaltsstandards bezieht, die jeder Staat entwickelt hat und normalerweise online veröffentlicht.
Hier ist ein Algebra-Standard aus dem Common Core: Löse lineare Gleichungen und Ungleichungen in einer Variablen, einschließlich Gleichungen mit Koeffizienten, die durch Buchstaben dargestellt werden. (Interessierte Leser können hier andere Standards für Algebra sehen und alle Standards hier finden.)
Dieser Standard gibt einer Lehrerin an, dass ihre Schüler dazu in der Lage sein sollten: Bestimmen Sie für die Gleichung 3x + 4 = 13, dass x gleich 3 ist. Oder, wenn die Gleichung ax + b = c ist, können Sie nach x gleich (c – b)/a . In dieser zweiten Gleichung werden Koeffizienten als Buchstaben dargestellt, wie es der Standard verlangt.Für die Lehrerin, die wissen möchte, ob ihre Schüler den Standard erfüllen, könnte sie denken, dass eine vernünftige Frage darin besteht, sie zu bitten, 15y + 10 = 40 zu lösen. Die Testfrage enthält einen subtilen Unterschied – die Schüler müssen eher nach y als nach x lösen -, aber es ist immer noch eine Gleichung mit einer einzigen Variablen. Der Lehrer kann den Schwierigkeitsgrad ein wenig erhöhen, indem er die Schüler auffordert, y + 3y + 10 = 50 zu lösen. Die Schüler müssen die beiden y-Terme hinzufügen, aber es ist immer noch eine Gleichung mit einer einzigen Variablen.
Diese schwierigen Fragen müssen da sein
Wenn der Test zu viele schwierige Fragen enthält und keine Schüler die richtigen Antworten erhalten, hat die Prüfung das, was Testdesigner einen Boden nennen. Wenn alle Schüler 0 Punkte erzielen, kann die Lehrerin nicht unterscheiden, was ihre Schüler wissen: Der Boden hindert die Lehrerin daran zu wissen, welche Schüler ein niedriges und welche ein hohes Niveau haben.
Wenn die Lehrerin den Test so einfach macht, dass viele Schüler alle richtigen Antworten erhalten, hat sie einen Deckeneffekt erzeugt. Einige Schüler haben wahre Fähigkeiten über ihrer Punktzahl, aber die Decke hindert den Lehrer daran, es zu wissen, denn wenn alle Testergebnisse zu 100 Prozent sind, sehen alle Schüler gleich aus.
Um Decken- und Bodeneffekte zu vermeiden, benötigen Tests Fragen mit höheren und niedrigeren Schwierigkeitsgraden. Schüler mit starkem Wissen sind in der Lage, die schwierigeren Fragen zu beantworten; Schüler mit schwächeren Kenntnissen sind es nicht.Der gleiche Entwicklungsprozess wird in einem viel größeren Maßstab für Assessments wie den PARCC-Test (das Akronym steht für Partnership for Assessment of Readiness for College and Careers), Smarter Balanced und den Texas STAAR-Test, den State of Texas Assessment of Academic Readiness, verwendet. Hier sind die Standards der Ausgangspunkt für die Gestaltung der Tests (hier ist eine Visualisierung des Prozesses).Pädagogen und Testexperten entwickeln Banken von Fragen zu diesen Standards, wie die Algebra Fragen oben. Diese werden überprüft, um sicherzustellen, dass sie testen, was die Standards verlangen und dass ihre Formulierung klar und nicht unangemessen oder voreingenommen gegen Rasse oder Geschlecht ist.Zum Beispiel könnte eine mathematische Frage, die die Berechnung des Schlagdurchschnitts eines Baseballspielers beinhaltet, ein Problem für Schüler darstellen, die nicht Baseball spielen oder mit seinen Regeln nicht vertraut sind. Eine Überarbeitung des Wortlauts zur Berechnung eines einfachen Durchschnitts ohne Bezugnahme auf Baseball könnte die Lösung sein, ebenso wie das einfache Ersetzen einer anderen Frage.
In diese Tests werden mühevolle Anstrengungen investiert. Jede Frage zu den PARCC-Prüfungen wird beispielsweise von 30 oder mehr Personen überprüft, bevor sie verwendet wird. Fragen, die den Schnitt machen, werden dann in 14 Staaten und fast 16.000 Schulen pilotgetestet. Smarter Balanced folgt einem ähnlichen Prozess und testet mehr als 5.000 Artikel in 21 Bundesstaaten und mehr als 5.000 Schulen.
In jeder Klassenstufe wird der Test wahrscheinlich mindestens ein paar wirklich schwierige Fragen enthalten, die weit über die Fähigkeiten der Schüler in dieser Klasse hinausgehen. Schüler (und Lehrer) neigen dazu, sich an diese Art von Fragen zu erinnern, aber sie sind nicht auf dem Test, nur um Schmerzen und Unbehagen zu verursachen. Vielmehr vermeidet das Säen des Tests mit schwierigen Fragen den Deckeneffekt und hilft bei der Unterscheidung zwischen Schülern mit Grundkenntnissen und Schülern auf fortgeschrittenem Niveau. Es könnte immer noch Studenten geben, die alle Fragen falsch oder richtig stellen, aber das Design der Tests macht es unwahrscheinlich, dass dies geschieht.
Einige Beschwerden sind verdient, andere nicht
Einige Aspekte von Tests ziehen zu Recht Beschwerden nach sich. Zum Beispiel sind Test-Score-Berichte an Eltern oft mit statistischem Jargon wie Normen, Perzentilen, Normalkurvenäquivalenten, Grenzen, Lexilen und Kompetenzniveaus beladen, die auf … wer weiß was basieren.Ein Elternteil, dessen Kind in der vierten Klasse das 65. Perzentil und in der fünften Klasse das 65. Perzentil erreicht, könnte sich fragen, ob er oder sie still steht. Das Kind ist es nicht – tatsächlich hat der Schüler ein Jahr Material gelernt, weil das Kind besser abgeschnitten hat als 65 Prozent der Viertklässler und dann, ein Jahr später, besser als 65 Prozent der Fünftklässler. Testdesigner haben sich jedoch keinen Gefallen getan, indem sie Berichte bereitgestellt haben, bei denen Eltern sich mit statistischen Konzepten auseinandersetzen müssen, um die Punktzahlen zu verstehen.Einige Eltern sehen möglicherweise die Testergebnisse eines Kindes und denken, dass es falsch sein muss, weil sie wissen, dass ihr Kind besser in Mathe (oder Lesen oder Naturwissenschaften) ist. Vielleicht hatte der Student einen freien Tag – Krankheit, familiäre Ablenkung, ein ausgelassenes Frühstück. Eltern sollten die Ergebnisse vor dem Hintergrund anderer Indikatoren dafür anzeigen, wie es ihrem Kind in der Schule geht, z. B. Noten auf Zeugnissen.Eltern können auch besorgt sein, dass die Testergebnisse ihres Kindes als Grundlage für die Bewertung des Lehrers ihres Kindes verwendet werden, eine Entwicklung in den letzten zehn Jahren, die als Reaktion auf den Druck auf Staaten und Schulbezirke entstanden ist, Testergebnisse zu erhöhen. Kümmert sich der Lehrer ihres Kindes nicht mehr um die Partitur als um ihr Kind?Nun, nein – die meisten Systeme zur Bewertung von Lehrern geben den Punktzahlen nur ein moderates Gewicht, während die Organisation und Verwaltung von Klassenzimmern mehr Gewicht erhält. Und die Vorstellung, dass Lehrer, die sich um höhere Punktzahlen kümmern, eine schlechte Sache sind, spiegelt eine verkehrte Sichtweise der Bildung wider, in der Lehrer ihre Ziele erreichen – ihre Schüler lernen zu lassen, was in den Standards steht — ist irgendwie ein Problem.
Einige Debatten über Tests basieren auf einer schwachen Basis. Zum Beispiel nehmen jährliche Zustandstests nicht viel Unterrichtszeit in Anspruch. Eltern können besorgt sein, dass der Lehrer ihres Kindes zum Test unterrichtet, aber, wie oben beschrieben, Tests sollen das Wissen über dieselben Standards messen, auf denen die Lehrpläne im Klassenzimmer basieren.
Wenn sich dieses Schuljahr entfaltet, sollten wir uns daran erinnern, warum Staaten Schüler testen: um zu sehen, ob sie auf der entsprechenden Klassenstufe lernen. Und lassen Sie uns verstehen, dass Tests durch einen zuverlässigen Prozess erstellt werden, ähnlich wie die Prüfungen, die unsere Ärzte, Anwälte und Buchhalter ablegen müssen.Mark Dynarski, Gründer und Präsident von Pemberton Research, ist Education Fellow am George W. Bush Institute.
Senden Sie einen Brief an den Herausgeber