새로운 학년도에서는 전체 힘,그래서 학교가 시작 부분에 대해 생각하는 학생들을 만나 그들의 국가의 학업 기준입니다. 그들은 또한 가능성에 대해 먼저 생각 상태를 성취하 테스트,독립적이고 객관적인 시험을 학생들이 취하는지 여부를 결정은 학습에 적합한 등급 수준입니다.동시에 일부 부모는 자녀를 그 시험에서 벗어나야하는지 궁금해 할 수도 있습니다. 개별적인 행동으로,시험에서 탈퇴는 연례 건강 검진 탈퇴와 같습니다-그것은 정보를 산출하지 않으며 더 건강하지 않습니다. 집단적 행동으로,탈퇴는 시험 점수에서 배울 수있는 것을 침식합니다. 경우 부모님의 성과가 높은 학생들이 학교에서 모든 거부하는 학교의 평균 점수가 낮은 것입니다(그리고 반대로 낮은 수행하는 학생). 누가 도움을 받고 있는지는 분명하지 않습니다.
어떤 시험 시험은 학생들이 배우기를 원하는 주—표준을 반영합니다. 학교와 지구 간의 평균 점수를 비교하는 것은 동일한 테스트가 수행되기 때문에 가능합니다. 에서 측정 학생들이 무엇을 알고,시험은 엄청난 자산,제공하는 중요하고 신뢰할 수 있는 정보에서 배울 수 없는 다른 방법이다.물론 많은 사람들이 시험을 치르기를 고대하지는 않습니다. 그러나 우리가 의사의 벽을보고 그녀가 보드 인증을받은 플라크를 볼 때,우리는 인증이 좋은 일이라고 생각할 수 있습니다. 의사가 검사를 통과했습니다. 또는 변호사가 술집에 입학 할 수도 있는데,이는 그가 주정부의 변호사 시험 인 시험에 합격했음을 의미합니다. 공인 회계사는 시험의 배터리를 통과 한 것입니다. 아무도 지식이 받아 들여지는 표준 이하인 의사,변호사 또는 회계사를 원하지 않습니다.학교에서도 마찬가지입니다. 그래서 한 걸음 물러서서 중요한 질문을하는 것이 유용합니다:시험 점수는 아이가 알고있는 것을 반영합니까? 그렇다면,그것이하도록 설계된 것을하고 있습니다. 시험 점수가 종종의 조롱으로 결과의”교육,테스트에”그러나 어떤 사람들이 사용하는 문구가 정말에 대해 불평가 및 기계적 생명이 없는 가르침이다. 생명이없는 가르침과 시험에 대한 가르침은 두 가지 다른 것입니다. 시험에 대한 실제 교육은 시험이 학생들이 배워야 할 것을 반영하는 한 효과적인 교육의 핵심입니다.
어떻게 테스트를 만든
하는 부모는 없습 교육자,만드는 과정을 표준화된 테스트처럼 보일 수 있습니다 큰 블랙 박스. 사실,그것은 매우 엄격하고 과학적인 프로세스 하는 것이 개발되었 100 년 이상과 연구를 반영하여 세대의 존경하는 분들입니다. 그것은 자신의 서브 필드,심리 측정학을 가지고 있으며,매년 대학은 새로운 박사 학위를 졸업합니다.그 서브 필드에있어.
우리는 먼저 미니어처로 테스트 개발을 생각함으로써 대규모 테스트 개발에 대해 생각할 수 있습니다. 고등학교 교사가 대수학에서 선형 방정식과 관련된 테스트를 설계하는 방법에 대해 어떻게 갈 수 있는지 고려하십시오.
교사 전달이 특정 물질의 양을 주제에 대한 형태의 교육,과제,그리고 다른 할당을 좋아하는 그룹 활동 또는 온라인 수업이 있습니다. 결정적으로,교사가 가르친 것은 각 주에서 개발 한 일련의 콘텐츠 표준과 관련이 있어야하며 일반적으로 온라인에 게시됩니다.
여기에는 대수준에서 일반적인 코어:해결선형 방정식과 불평등에서 하나의 변수를 포함하여 계수와 방정식에 의해 표현된다. (관심있는 독자는 여기에서 대수학에 대한 다른 표준을 볼 수 있으며 여기에서 모든 표준을 찾을 수 있습니다.)
교사에게,이 표준은 그녀의 학생들이 이것을 할 수 있어야 함을 나타냅니다:방정식 3x+4=13 에 대해 x 가 3 과 같다고 결정하십시오. 는 경우 또는,방정식 ax+b=c,를 해결할 수 있 x equals(c–b)/니다. 에서 이 두 번째 방정식,계수 표시 문자로 표준화한다.
선생님을 알기를 원하는 경우에 그녀의 학생들을 만나 표준,그녀는 생각할 수 있는 합리적인 질문을 요청하는 것입을 해결하기 위해 그들을 15y+10=40. 시험 문제에는 미묘한 차이가 포함되어 있습니다-학생들은 x 가 아닌 y 에 대해 해결해야합니다-하지만 여전히 단일 변수가있는 방정식입니다. 교사는 학생들에게 y+3y+10=50 을 해결하도록 요청하여 난이도를 조금 올릴 수 있습니다. 학생들은 두 개의 y 항을 추가해야하지만 여전히 단일 변수가있는 방정식입니다.
어려운 사람들이 질문할 필요가 있
경우 테스트가 포함되어 있습니다 너무 많은 어려운 질문,그리고 어떤 학생들은 모든 권리는,시험은 무엇인 디자이너 테스트를 호출합니다 모든 학생들이 득점하 0,교사를 구분할 수 없습니다 무엇이 그녀의 학생들에게 알:바닥이 블록 교사에서 알고 있는 학생들은 낮은 수준의 기술과 높은 수준입니다.
마찬가지로 교사가 테스트는 많은 학생 들이 모든 답변을 얻을,오른쪽 그녀가 만든 천장 효과가 있다. 일부 학생들이 진정한 능력은 위의 그들의 점수,그러나 천장이 블록 교사에서 그것을 알기 때문에 모든 시험 점수가 100 퍼센트,모든 학생들이 동일하게 보입니다.
천장 및 바닥 효과를 피하기 위해 시험에는 더 높고 낮은 난이도의 질문이 필요합니다. 강한 지식을 가진 학생들은 어려운 질문에 대답 할 수 있습니다;약한 지식을 가진 학생들은 그렇지 않습니다.
동일한 개발 프로세스를 사용에 훨씬 더 큰 규모에 대한 평가와 같은 PARCC 테스트(약어를 의미 파트너십의 평가를 위한 준비를 위한 대학 경력),스마트 밸런스,텍사스 STAAR 테스트,텍사스 주의 평가는 학술 대비할 수 있습니다. 여기서 표준은 테스트를 설계하기위한 출발점입니다(여기서는 프로세스의 시각화입니다).
교육자 및 테스트 전문가는 위의 대수학 질문과 같은 표준과 관련된 질문 은행을 개발합니다. 이들은 자세히 조사하도록 테스트 기준을 통과하는 그들의 표현에 명확하지 않을 부적절하거나 편견에 대해 어떤 경 or gender.
예를 들어,수학을 포함하는 질문을 계산하는 야구 선수의 타율을 야기할 수 있는 문제에 대한 학생들이 재생되지 않는 야구 또는 익숙하지 않은 규칙이 있습니다. 을 개정하는 표현에 대한 것을 계산하는 간단 평균없이 참조하는 야구될 수 있는 솔루션으로,단순히 대체하는 또 다른 질문입니다.
근면 한 노력이 이러한 테스트에 투자됩니다. 예를 들어 PARCC 시험의 각 질문은 30 명 이상이 사용하기 전에 검토합니다. 컷을 만드는 질문은 14 개 주와 거의 16,000 개의 학교에서 파일럿 테스트를 거쳤습니다. Smarter Balanced 는 21 개 주와 5,000 개 이상의 학교에서 5,000 개 이상의 항목을 테스트하는 유사한 프로세스를 따릅니다.
에서 발급 수준 테스트가 포함될 가능성이 적어도 몇 가지 정말 어려운 질문을 수 있는 것을 넘어 능력 학생들의 학년. 학생(교사)기억하는 경향이 있는 이러한 종류의 질문,하지만 그들은 시험에 간단하게 만들 수 있습니다. 오히려,시드 테스트로 어려운 질문을 피 천장 효과를 파악할 수 있도록 지원 간의 학생들은 기본적인 수준의 능력과 그에서 고급 수준입니다. 여전히 모든 질문을 잘못하거나 올바르게하는 학생이있을 수 있지만 테스트의 설계로 인해 발생할 가능성은 희박합니다.
일부 불만은 자격이 있으며,일부는
테스트의 일부 측면은 당연히 불만을 제기합니다. 예를 들어,시험 점수 보고서를 부모가 자주 실는 통계적 전문 용어와 같은 규범의 백분위,정상적인 곡선 등가물,stanines,lexiles,그리고 능력 수준을 기반으로 하는 누가 무엇을 알고있다.
부모는 자식수에서 65 백분위에서 네 번째 학년 및 65 백분위에서 다섯 번째 학년 수 있는지 궁금해 그 또는 그녀는 여전히 서있다. 아이가 없는—사실,학생들은 배운의 올해의 가치료기 때문에,아이 득점 더보다 65%의 네 번째 학년 그리고,나중에 년,더 이상의 65 퍼센트 다섯 번째 학년. 그러나 시험 디자이너들이 자신의 일을 아무에 의해 호의를 제공하는 보고서는 필요로 부모님을 잡는 통계적 개념의 이해하 점수가 있습니다.
어떤 부모들은 아기의 시험 및어야합니다 생각이 잘못 알고 있기 때문에 그들은 자신의 아이가 더 나은 수학에서(또는 읽기,또는 과학)니다. 아마도 학생은 쉬는 날을 보냈을 것입니다-질병,가족 산만,건너 뛴 아침 식사. 학부모는 성적표의 성적과 같이 자녀가 학교에서 어떻게하고 있는지에 대한 다른 지표를 배경으로 점수를보아야합니다.
부모 또한 우려 할 수 있는 아이들의 시험 성적은 사용에 대한 기준으로 평가하는 아이들의 교사,개발에 과거 십년간에 등장한 반응하는 압력에서 미국 및 지역 학교를 인상 시험 점수가 있습니다. 자녀의 교사는 자녀에 관한 것보다 점수에 대해 더 신경 쓰지 않습니까?
만,없는 대부분의 시스템에 대한 평가는 교사에게만 적당량을 점수면서,구성하고 관리하는 교실을 얻을 더 무게. 와 개념에는 교사들에 대해 걱정은 높은 점수가 나쁜 일을 반영하는 거꾸기의 교육에서 교사가 달성하고 그들의 목표는 학생들은 무엇에 표준이 어떻게 든 문제입니다.
테스트에 대한 몇 가지 논쟁은 어설픈 기반으로 구축됩니다. 예를 들어,연간 주 테스트는 많은 교육 시간을 차지하지 않습니다. 부모를 우려 할 수 있는 아이들의 교사는 교수를 시험에 들게 하지 마옵시고 다만,위에 설명된 대로,테스트는 설계를 측정에 대한 지식이 동일한 기준에는 교실을 교육과정을 기반으로합니다.
그래서 이 학교는 올해 펼쳐지 기억하자,유 테스트생하는지 여부를 확인들이 학습에 적합한 등급 수준입니다. 고 이해 할 수 있는 테스트를 통해 만들어진 신뢰할 수 있는 프로세스는 훨씬 다음과 같은 시험은 우리의 의사,변호사,회계사해야 합니다.
Pemberton Research 의 설립자이자 사장 인 Mark Dynarski 는 George W.Bush Institute 의 교육 연구원입니다.
편집자에게 편지 제출