新しい学年が完全に施行されているので、学校は学生が彼らの州の学術基準を満たすために軌道に乗っているかどうかについて考え始めています。 彼らはまた、州の達成テスト、独立した客観的な試験の学生が適切な学年レベルで学習しているかどうかを判断するために先に考えている可能性が同時に、いくつかの親は、彼らがそれらのテストから自分の子供を選ぶべきかどうか疑問に思うかもしれません。
同時に、いくつかの親は、彼らが 個々の行為として、テストのオプトアウトは、毎年恒例の健康診断をオプトアウトするようなものです—それは情報をもたらさず、健康にはなりません。 集団的な行為として、オプトアウトは、テストの点数から学ぶことができるものを侵食します。 学校の成績の高い学生の両親がすべてオプトアウトした場合、その学校の平均スコアは低くなります(成績の低い学生の場合はその逆も同様です)。 誰が助けられているのかは不明です。
どのような試験のテストは、状態が彼らの学生が学びたいものを反映している—基準。 学校と地区の平均スコアを比較することは、同じテストが行われているためにのみ可能です。 学生が知っているものを測定する際には、テストは他の方法で学ぶことができない重要で信頼できる情報を提供し、途方もない資産です。確かに、多くの人がテストを受けることを楽しみにしていません。
確かに、テストを楽しみにしています。
しかし私達が私達の医者の壁で見、彼女が板証明されるプラークを見るとき、私達は証明がよい事であることを考えるかもしれない。 医者はテストに合格した。 または弁護士は、彼が州の司法試験—テストに合格したことを意味し、バーに入院するかもしれません。 公認会計士は、テストのバッテリーに合格しています。 誰も、その知識が受け入れられた基準を下回っている医師、弁護士、または会計士を望んでいません。同じことが学校でも当てはまるはずです。
だから、一歩後退して重要な質問をするのは便利です:テストのスコアは子供が知っていることを反映していますか? もしそうなら、それはそれがするように設計されていることをやっています。 試験のスコアは、多くの場合、”テストへの教育”の結果であるとして嘲笑されているが、そのフレーズを使用する人々が本当に不平を言っているものは、丸暗記 生きていない教えとテストへの教えは二つの異なるものです。 試験は、学生が学ぶことになっているものを反映している限り、テストへの実際の教育は、効果的な教育の中心です。
テストの作成方法
教育者ではない親にとって、標準化されたテストを作成するプロセスは大きなブラックボックスのように見えるかもしれ 実際、それは厳密で高度に科学的なプロセスであり、100年以上にわたって開発され、尊敬される学者の世代による研究を反映しています。 それは独自のサブフィールド、心理測定学を持っており、毎年大学は新しい博士号を卒業します。そのサブフィールドのs。
まずテスト開発をミニチュアで考えることで、大規模なテスト開発について考えることができます。 高校の教師が、代数の線形方程式などに関連するテストをどのように設計するかを考えてみましょう。
教師は、教室での指導、宿題、およびグループ活動やオンラインレッスンのような他の割り当ての形で、主題に関する一定量の資料を提供しました。
重要なことに、教師が教えたことは、各州が開発し、通常はオンラインで投稿した一連のコンテンツ基準に関連する必要があります。
ここでは、共通のコアからの代数標準です:文字で表される係数を持つ方程式を含む、1つの変数で線形方程式と不等式を解きます。 (興味のある読者はここで代数の他の標準を見ることができ、ここですべての標準を見つけることができます。教師にとって、この基準は、彼女の生徒がこれを行うことができるはずであることを示しています:方程式3x+4=13に対して、xが3に等しいことを決定 または、方程式がax+b=cの場合、x=(c–b)/aを解くことができます。彼女の生徒が基準を満たしているかどうかを知りたい教師にとって、彼女は合理的な質問は15y+10=40を解くように頼むことだと思うかもしれません。
テストの質問には微妙な違いが含まれています—学生はxではなくyを解く必要があります—しかし、それはまだ単一の変数を持つ方程式です。 教師は、y+3y+10=50を解くように生徒に尋ねることによって、難易度を少し上げるかもしれません。 学生は2つのy項を追加する必要がありますが、それはまだ単一の変数を持つ方程式です。
これらの難しい質問はそこにある必要があります
テストには難しい質問があまりにも多く含まれており、学生が正しい答えを得ていない場 すべての生徒が0を得点していると、教師は生徒が知っていることを区別することはできません:床は、どの生徒が知識のレベルが低く、どのレベルが高同様に、教師がテストを非常に簡単にして、多くの学生がすべての答えを正しく得ると、彼女は天井効果を作成します。
同様に、教師がテストを簡単に 一部の学生は、彼らのスコアの上に真の能力を持っていますが、すべてのテストの点数が100パーセントであるとき、すべての学生が同じに見えるので、天井
天井と床の影響を避けるために、テストでは難易度の高い質問と低い質問が必要です。 強い知識を持つ学生は難しい質問に答えることができ、弱い知識を持つ学生はそうではありません。
同じ開発プロセスは、PARCCテスト(頭字語は大学とキャリアのための準備の評価のためのパートナーシップの略)、スマートバランス、およびテキサス州STAARテス ここでは、標準はテストを設計するための出発点です(ここではプロセスの可視化です)。
教育者やテストの専門家は、上記の代数の質問など、これらの基準に関連する質問の銀行を開発しています。 これらは、基準が求めるものをテストし、その文言が明確で、人種や性別に対して不適切または偏っていないことを確認するために精査されています。
例えば、野球選手の打率を計算することを含む数学の質問は、野球をしていないか、そのルールに慣れていない学生のための問題を提起するかもしれ 野球を参照せずに単純な平均を計算することについての文言を修正することは、単に別の質問を置き換えるかもしれないので、解決策かもしれません。
骨の折れる努力は、これらのテストに投資されています。 たとえば、PARCC試験の各質問は、使用される前に30人以上の人によってレビューされます。 カットを行う質問は、その後、14の州とほぼ16,000の学校でパイロットテストされます。 Smart Balancedは同様のプロセスに従い、21州で5,000以上の項目と5,000以上の学校をテストします。
どの学年レベルでも、テストには少なくともその学年の学生の能力をはるかに超えているように見えるかもしれないいくつかの本当に難しい問 学生(および教師)は、これらの種類の質問を覚えている傾向がありますが、単に痛みや不快感を作り出すためのテストではありません。 むしろ、困難な質問でテストを播種することは、天井の効果を回避し、能力の基本的なレベルを持っている学生と高度なレベルでそれらを区別するのに まだすべての質問が間違っているか正しいかを得る学生がいるかもしれませんが、テストの設計は起こりそうにありません。
いくつかの苦情は当然であり、いくつかはありません
テストのいくつかの側面は当然の苦情を描きます。 たとえば、親へのテストスコアレポートには、規範、百分位数、通常の曲線の同等物、stanines、lexiles、および誰が何を知っているかに基づいた習熟度などの統計的専門用語が
子供が四年生の65パーセンタイルと五年生の65パーセンタイルでスコアを持つ親は、彼または彼女がまだ立っているかどうか疑問に思うかもしれません。
子供はそうではありません-実際には、子供が四年生の65パーセントよりも優れて得点し、その後、一年後、五年生の65パーセントよりも優れているので、学生は、 しかし、テスト設計者は、スコアの意味を理解するために統計的概念に取り組むために両親を必要とするレポートを提供することによって、自分自身いくつかの親は、子供のテストのスコアを見て、彼らは彼らの子供がそれよりも数学(または読書、または科学)で優れている知っているので、それは間違っ おそらく、学生は休みの日に病気、家族の気晴らし、スキップされた朝食を持っていました。 親は、レポートカードの成績など、子供が学校でどのようにしているかの他の指標を背景にスコアを表示する必要があります。
親はまた、彼らの子供のテストの点数は、彼らの子供の教師、テストの点数を上げるために州や学区への圧力に応じて現れた過去十年の開発を評価 彼らの子供の先生は、自分の子供についてよりもスコアについての詳細を気にしませんか?
まあ、評価教師のためのほとんどのシステムは、スコアに適度な重みしか与えませんが、教室の整理と管理はより多くの重みを得ます。 そして、より高いスコアを気にする教師が悪いことであるという概念は、教師が目標を達成する-生徒に基準にあるものを学ばせる—が何らかの形で問
テストに関するいくつかの議論は、薄っぺらなベースで構築されています。 たとえば、毎年の州のテストでは、多くの教育時間を要しません。 親は、子供の教師がテストに教えていることを心配するかもしれませんが、上記のように、テストは、教室のカリキュラムが基づいているのと同じ基準
だから、この学年が展開するように、のは、なぜ状態テスト学生を覚えてみましょう:彼らは適切な学年レベルで学んでいるかどうかを確認します。 そして、私たちの医師、弁護士、会計士が取らなければならない試験のように、信頼できるプロセスを通じてテストが作成されることを理解しましょう。
Pemberton Researchの創設者兼社長であるMark Dynarskiは、George W.Bush Instituteの教育フェローです。
編集者に手紙を提出する