[PE038] 算数学力評価ルーブリックの妥当性検討の試み
面積学習領域を例として
Keywords:ルーブリック, 学力, 算数
問題と目的
近年,心理計量・教育測定の分野において,IRTモデルを用いて「学力」を単一の尺度上で表現する試みがなされてきている。しかし,大規模テストを前提とするこの手法から得られた尺度値(θ)そのものだけでは教育現場における実際の指導に活用しにくいという問題点が指摘できる。これにこたえるため,佐藤・柴山(2013)では,算数面積学習領域を例に,IRTモデルにより算出された尺度値のレベル毎のパフォーマンス評価ルーブリックの作成を試みた。本報告ではそれに引きつづき,ルーブリックの内容と実際の学習指導との整合性をさらに向上させ,調査対象人数を増やすとともに,教員へのアンケート実施を行うことにより,ルーブリックの妥当性を検討することを目的とする。
方 法
調査対象者:山形県内公立A,B,C小学校の第6学年児童121名。手続き:算数学力テスト,面積テストの問題冊子への解答を求めた。またB,C小学校の担任3名を対象に,ルーブリックの妥当性に関する教員アンケートを実施した。課題構成:【算数学力テスト】平成18年度の新潟県学力テストを使用し,面積に関する問題のうち2問を削除した(全23問)。【面積テスト】等積変形課題(対提示,連続性),等周長変形課題(対提示,連続性)よりなる(工藤・白井,1991など参照)。いずれも底辺,高さの相対的大小を読み取り,そこから面積の大小を導出する必要がある問題である。教員アンケート:佐藤・柴山(2013)でみられた面積課題の判断理由(a高さへの着目,b公式算出,c切り貼り変形,d周長への着目,e動作への着目)に対して,それぞれ面積の理解度を5段階で評定を求め,またa~eについて理解が深い順に並べてもらった。各パラメタの推定:項目パラメタ(識別力,困難度)の推定には,平成18年度新潟県学力テストのデータ(受検者:小学5年生21,735名,2006年1月実施)を用いた(推定方法は周辺最尤法,事前分布は標準正規分布)。受検者パラメタ(尺度値θ)の推定は最尤法による。算数テスト全問正答者は分析から除外した。これらのパラメタ推定にはEasyEstimation(熊谷,2009)を使用した。
結果と考察
算数テスト全問正答者7名,テスト欠席者2名,回答不備1名を除外した111名が分析対象者となった。IRTにより算出された尺度値(θ)の平均は0.04(SD1.17,Min.-2.57,Max.2.45)であった。これについてレベル毎L(-2.57~-0.59),M(-0.59~0.43),H(0.47~2.45)の3群(N=37)に分類し各面積課題の正答率を算出した(Figure1)。学力レベルが上がるにつれて正答率も高くなる傾向にあること,特にM群で課題間の正答率の開きが大きいことがうかがえた。そこで各面積判断の理由についてa高さへの着目,b公式算出,c切り貼り変形,d周長への着目,e動作への着目に分類し,レベルごとに出現頻度を算出した。その結果,適切属性(a,b)への言及はL<M<Hであった一方,不適切属性(d,e)はH<M=Lであった。学力レベルが高いほど,不適切属性への着目を回避し高さや公式を利用した面積比較が可能になるといえる。以上より,Lでは不適切属性に着目しがちであり面積の大小の導出が困難であること,Mでは図形の底辺・高さを読み取り公式代入による面積比較が可能であるが,課題によっては不適切属性が関与すること,Hでは具体的数値が示されていなくとも,それらの相対的な大小関係に着目して面積比較が可能であることが示唆される。また,教員アンケートの結果,3名中2名が判断理由について理解度の高い順にa, b, c, d, eと示していたことから,作成したルーブリックについてある程度の妥当性が得られたといえる。
近年,心理計量・教育測定の分野において,IRTモデルを用いて「学力」を単一の尺度上で表現する試みがなされてきている。しかし,大規模テストを前提とするこの手法から得られた尺度値(θ)そのものだけでは教育現場における実際の指導に活用しにくいという問題点が指摘できる。これにこたえるため,佐藤・柴山(2013)では,算数面積学習領域を例に,IRTモデルにより算出された尺度値のレベル毎のパフォーマンス評価ルーブリックの作成を試みた。本報告ではそれに引きつづき,ルーブリックの内容と実際の学習指導との整合性をさらに向上させ,調査対象人数を増やすとともに,教員へのアンケート実施を行うことにより,ルーブリックの妥当性を検討することを目的とする。
方 法
調査対象者:山形県内公立A,B,C小学校の第6学年児童121名。手続き:算数学力テスト,面積テストの問題冊子への解答を求めた。またB,C小学校の担任3名を対象に,ルーブリックの妥当性に関する教員アンケートを実施した。課題構成:【算数学力テスト】平成18年度の新潟県学力テストを使用し,面積に関する問題のうち2問を削除した(全23問)。【面積テスト】等積変形課題(対提示,連続性),等周長変形課題(対提示,連続性)よりなる(工藤・白井,1991など参照)。いずれも底辺,高さの相対的大小を読み取り,そこから面積の大小を導出する必要がある問題である。教員アンケート:佐藤・柴山(2013)でみられた面積課題の判断理由(a高さへの着目,b公式算出,c切り貼り変形,d周長への着目,e動作への着目)に対して,それぞれ面積の理解度を5段階で評定を求め,またa~eについて理解が深い順に並べてもらった。各パラメタの推定:項目パラメタ(識別力,困難度)の推定には,平成18年度新潟県学力テストのデータ(受検者:小学5年生21,735名,2006年1月実施)を用いた(推定方法は周辺最尤法,事前分布は標準正規分布)。受検者パラメタ(尺度値θ)の推定は最尤法による。算数テスト全問正答者は分析から除外した。これらのパラメタ推定にはEasyEstimation(熊谷,2009)を使用した。
結果と考察
算数テスト全問正答者7名,テスト欠席者2名,回答不備1名を除外した111名が分析対象者となった。IRTにより算出された尺度値(θ)の平均は0.04(SD1.17,Min.-2.57,Max.2.45)であった。これについてレベル毎L(-2.57~-0.59),M(-0.59~0.43),H(0.47~2.45)の3群(N=37)に分類し各面積課題の正答率を算出した(Figure1)。学力レベルが上がるにつれて正答率も高くなる傾向にあること,特にM群で課題間の正答率の開きが大きいことがうかがえた。そこで各面積判断の理由についてa高さへの着目,b公式算出,c切り貼り変形,d周長への着目,e動作への着目に分類し,レベルごとに出現頻度を算出した。その結果,適切属性(a,b)への言及はL<M<Hであった一方,不適切属性(d,e)はH<M=Lであった。学力レベルが高いほど,不適切属性への着目を回避し高さや公式を利用した面積比較が可能になるといえる。以上より,Lでは不適切属性に着目しがちであり面積の大小の導出が困難であること,Mでは図形の底辺・高さを読み取り公式代入による面積比較が可能であるが,課題によっては不適切属性が関与すること,Hでは具体的数値が示されていなくとも,それらの相対的な大小関係に着目して面積比較が可能であることが示唆される。また,教員アンケートの結果,3名中2名が判断理由について理解度の高い順にa, b, c, d, eと示していたことから,作成したルーブリックについてある程度の妥当性が得られたといえる。