Une nouvelle année scolaire est en vigueur, de sorte que les écoles commencent à se demander si les élèves sont sur la bonne voie pour répondre aux normes académiques de leur État. Ils réfléchissent également probablement à l’avenir aux tests de réussite de l’État, aux examens indépendants et objectifs que les étudiants passent pour déterminer s’ils apprennent au niveau scolaire approprié.
Dans le même temps, certains parents pourraient se demander s’ils devraient retirer leur enfant de ces tests. En tant qu’acte individuel, se retirer des tests revient à se retirer des examens médicaux annuels — cela ne donne aucune information et ne rend pas plus sain. En tant qu’acte collectif, le retrait érode ce qui peut être appris des résultats des tests. Si les parents d’élèves très performants d’une école se retirent tous, le score moyen de cette école sera plus bas (et vice versa pour les élèves peu performants). Qui est aidé n’est pas clair.
Quel test d’examen reflète ce que les États veulent que leurs étudiants apprennent — les normes. La comparaison des scores moyens entre les écoles et les districts n’est possible que parce que le même test est effectué. Pour mesurer ce que les élèves savent, les tests constituent un atout considérable, car ils fournissent des informations importantes et fiables qui ne peuvent être apprises autrement.
Pour être sûr, peu de gens ont hâte de passer des tests. Mais quand nous regardons sur le mur de notre médecin et voyons une plaque indiquant qu’elle est certifiée par le conseil d’administration, nous pourrions penser que la certification est une bonne chose. Le médecin a passé un test. Ou un avocat pourrait être admis au barreau, ce qui signifie qu’il a réussi l’examen du barreau de l’État — un test. Un expert-comptable agréé aura passé une batterie de tests. Personne ne veut d’un médecin, d’un avocat ou d’un comptable dont les connaissances sont inférieures à la norme acceptée.
Il devrait en être de même dans les écoles. Il est donc utile de prendre du recul et de poser une question importante: le score au test reflète-t-il ce que sait un enfant? Si c’est le cas, il fait ce pour quoi il est conçu. Les résultats des examens sont souvent ridiculisés comme étant le résultat de « l’enseignement au test”, mais ce dont se plaignent vraiment les gens qui utilisent cette expression, c’est un enseignement par cœur et sans vie. L’enseignement sans vie et l’enseignement à l’épreuve sont deux choses différentes. Un véritable enseignement au test est essentiel à un enseignement efficace, tant que les examens reflètent ce que les élèves sont censés apprendre.
Comment les tests sont créés
Pour les parents qui ne sont pas des éducateurs, le processus de création de tests standardisés peut sembler être une grosse boîte noire. En fait, il s’agit d’un processus rigoureux et hautement scientifique, développé depuis plus de 100 ans et qui reflète les recherches de générations de chercheurs estimés. Il a son propre sous-domaine, la psychométrie, et chaque année, les universités obtiennent un nouveau doctorat.s dans ce sous-champ.
Nous pouvons penser au développement de tests à grande échelle en pensant d’abord au développement de tests en miniature. Considérez comment un enseignant du secondaire pourrait concevoir un test lié, par exemple, à des équations linéaires en algèbre.
L’enseignant a livré une certaine quantité de matériel sur le sujet sous forme d’enseignement en classe, de devoirs et d’autres tâches telles que des activités de groupe ou des leçons en ligne. De manière cruciale, ce que l’enseignant a enseigné devrait se rapporter à un ensemble de normes de contenu que chaque État a développées et publie généralement en ligne.
Voici une norme algébrique du Tronc commun: Résolvez des équations linéaires et des inégalités dans une variable, y compris des équations avec des coefficients représentés par des lettres. (Les lecteurs intéressés peuvent voir d’autres normes pour l’algèbre ici et peuvent trouver toutes les normes ici.)
Pour un enseignant, cette norme indique que ses élèves devraient pouvoir le faire : Pour l’équation 3x + 4 = 13, déterminez que x est égal à 3. Ou, si l’équation est ax + b = c, être capable de résoudre pour x égal à (c–b) / a. Dans cette deuxième équation, les coefficients sont représentés sous forme de lettres, comme l’exige la norme.
Pour l’enseignante qui veut savoir si ses élèves répondent à la norme, elle pourrait penser qu’une question raisonnable est de leur demander de résoudre 15y + 10 = 40. La question de test comprend une différence subtile — les étudiants doivent résoudre y plutôt que x – mais il s’agit toujours d’une équation avec une seule variable. L’enseignant peut augmenter un peu le niveau de difficulté en demandant aux élèves de résoudre y + 3y + 10 = 50. Les étudiants doivent ajouter les deux termes y, mais c’est toujours une équation avec une seule variable.
Ces questions difficiles doivent être là
Si le test contient trop de questions difficiles et qu’aucun étudiant n’obtient de réponses correctes, l’examen comporte ce que les concepteurs de tests appellent un plancher. Tous les élèves ayant obtenu une note de 0, l’enseignante ne peut pas distinguer ce que ses élèves savent: Le plancher empêche l’enseignante de savoir quels élèves ont un faible niveau de connaissances et lesquels ont un niveau élevé.
De même, si l’enseignante rend le test si facile que de nombreux élèves obtiennent toutes les réponses correctes, elle aura créé un effet de plafond. Certains élèves ont de vraies capacités au-dessus de leur score, mais le plafond empêche l’enseignant de le savoir car lorsque tous les résultats aux tests sont à 100%, tous les élèves se ressemblent.
Pour éviter les effets sur le plafond et le sol, les tests nécessitent des questions avec des degrés de difficulté plus élevés et plus faibles. Les étudiants ayant de solides connaissances sont capables de répondre aux questions les plus difficiles; les étudiants ayant des connaissances plus faibles ne le sont pas.
Le même processus de développement est utilisé à une échelle beaucoup plus grande pour des évaluations telles que le test PARCC (l’acronyme signifie le Partenariat pour l’Évaluation de la préparation à l’université et aux carrières), Smarter Balanced, et le test Texas STAAR, l’Évaluation de la préparation académique de l’État du Texas. Ici, les normes sont le point de départ de la conception des tests (voici une visualisation du processus).
Les éducateurs et les experts en tests développent des banques de questions liées à ces normes, telles que les questions d’algèbre ci-dessus. Ceux-ci sont examinés de près pour s’assurer qu’ils vérifient ce que les normes exigent et que leur formulation est claire et non inappropriée ou biaisée contre toute race ou sexe.
Par exemple, une question mathématique qui consiste à calculer la moyenne au bâton d’un joueur de baseball peut poser problème aux élèves qui ne jouent pas au baseball ou qui ne connaissent pas ses règles. Réviser le libellé pour qu’il s’agisse de calculer une moyenne simple sans faire référence au baseball pourrait être la solution, tout comme la simple substitution d’une autre question.
Des efforts minutieux sont investis dans ces tests. Chaque question des examens PARCC, par exemple, est examinée par 30 personnes ou plus avant d’être utilisée. Les questions qui font la coupe sont ensuite testées dans 14 États et près de 16 000 écoles. Smarter Balanced suit un processus similaire, testant plus de 5 000 articles dans 21 États et plus de 5 000 écoles.
À n’importe quel niveau scolaire, le test comprendra probablement au moins quelques questions très difficiles qui peuvent sembler bien au-delà des capacités des élèves de cette année. Les élèves (et les enseignants) ont tendance à se souvenir de ce genre de questions, mais elles ne sont pas sur le test simplement pour créer de la douleur et de l’inconfort. Au contraire, ensemencer le test avec des questions difficiles évite l’effet de plafond et aide à faire la distinction entre les étudiants qui ont un niveau de compétence de base et ceux qui ont un niveau avancé. Il peut encore y avoir des étudiants qui obtiennent toutes les questions incorrectes ou correctes, mais la conception des tests rend peu probable que cela se produise.
Certaines plaintes sont méritées, d’autres ne le sont pas
Certains aspects des tests attirent à juste titre des plaintes. Par exemple, les rapports de score aux tests aux parents sont souvent chargés de jargon statistique tel que les normes, les centiles, les équivalents de courbes normales, les stanines, les lexiles et les niveaux de compétence basés sur who qui sait quoi.
Un parent dont l’enfant obtient un score au 65e centile en quatrième année et au 65e centile en cinquième année peut se demander s’il est immobile. L’enfant ne l’est pas — en fait, l’élève a appris une année de matériel, car l’enfant a obtenu un meilleur score que 65% des élèves de quatrième année, puis, un an plus tard, mieux que 65% des élèves de cinquième année. Mais les concepteurs de tests ne se sont fait aucune faveur en fournissant des rapports qui obligent les parents à s’attaquer aux concepts statistiques pour donner un sens aux scores.
Certains parents peuvent voir le score d’un enfant au test et penser que cela doit être faux parce qu’ils savent que leur enfant est meilleur en mathématiques (ou en lecture ou en science) que cela. Peut-être que l’étudiant a eu un jour de congé — maladie, distraction familiale, petit-déjeuner sauté. Les parents devraient voir les scores dans le contexte d’autres indicateurs de la façon dont leur enfant va à l’école, tels que les notes sur les bulletins de notes.
Les parents peuvent également craindre que les résultats des tests de leur enfant soient utilisés comme base pour évaluer l’enseignant de leur enfant, un développement au cours de la dernière décennie qui est apparu en réponse à la pression exercée sur les États et les districts scolaires pour augmenter les résultats des tests. L’enseignant de leur enfant ne se souciera-t-il pas plus du score que de son enfant?
Eh bien, la plupart des systèmes de notation des enseignants ne donnent qu’un poids modéré aux scores, tandis que l’organisation et la gestion des salles de classe prennent plus de poids. Et l’idée selon laquelle les enseignants se soucient des scores plus élevés est une mauvaise chose reflète une vision de l’éducation qui est top, dans laquelle les enseignants accomplissant leurs objectifs – faire en sorte que leurs élèves apprennent ce qui est dans les normes — est en quelque sorte un problème.
Certains débats sur les tests sont construits sur une base fragile. Par exemple, les tests d’état annuels ne prennent pas beaucoup de temps d’instruction. Les parents peuvent être préoccupés par le fait que l’enseignant de leur enfant enseigne au test, mais, comme décrit ci-dessus, les tests sont conçus pour mesurer les connaissances sur les mêmes normes sur lesquelles les programmes scolaires sont basés.
Alors que cette année scolaire se déroule, rappelons-nous pourquoi les états testent les élèves: pour voir s’ils apprennent au niveau scolaire approprié. Et comprenons que les tests sont créés grâce à un processus fiable, tout comme les examens que nos médecins, avocats et comptables doivent passer.
Mark Dynarski, fondateur et président de Pemberton Research, est chercheur en éducation à l’Institut George W. Bush.
Envoyer une lettre à l’éditeur