| このページは 得点とはに関してが 2008年 04月 12日 17時18分51秒 にクロールしたキャッシュ情報です。 |
検索キーワード= 盗撮
優先キーワード= 盗撮
得点とは?
[ 82] 日本留学試験における得点等化について-JASSO
[引用サイト] http://www.jasso.go.jp/eju/touka.html
|
日本留学試験は年に2回実施され、その得点は2年間に渡って利用される。そのため、各大学、短期大学および専修学校などで実施される1回の入学選考において、最大で4回分の試験の成績が混在して利用され得る。毎回の試験では異なる内容の問題が出題される上、実施地域間の時差への対策等の理由から、同一実施回においても複数種類の問題冊子が利用されるので、1回の入学選考において4種類以上の異なる試験の得点が比較されることになる。 試験とは、「得点」というモノサシを使って能力レベルを測定するものである。しかし、能力レベルには長さや温度のように明確に定められた単位が無いので、このモノサシは試験の難易度等の違いによって全く別の目盛りが使われることになってしまう。左の図は、4つの試験甲・乙・丙・丁の得点と能力レベルの対応を表したものである。図から試験甲に比べて試験乙は高得点をとりにくく(問題が難しい)、試験丙は高得点をとりやすい(問題が易しい)ことがわかる。ここで、図中の受験者AとBの能力を比較する場合を考える。2人とも同じ試験を受けている限り、常にAはBよりも得点が高いので、Aの方が高い能力を持っていることを正しく評価することができる。しかし、人によって受験する回が異なると、例えばAが乙、Bが丙を受験するような事態が生じる。この場合、Aが35点に対してBは70点となり、たまたま易しい試験を受けたBの方が、より高い能力を持っているとみなされてしまう。 このような事態は、各回の試験が難易度等の性質に関して等質でないために生じるので、まず第一に、毎回の試験問題を可能な限り等質なものにする努力をしていく必要がある。しかし、毎回異なる問題で構成される試験の性質を、完全に等質にすることは困難である。その結果、図のように極端な事態は生じなくとも、実施回によって取得できる得点が変わるようなことがあれば、たまたま難しい回を受験した人が不利益を被ることになる。図の場合は4つの試験の得点の対応が明示されているので、受験者Aの方がレベルが高いことが明らかであるが、実際の試験ではそのような得点の対応づけがされていないことが多い。そこで、異なる試験の得点を対応づけ、試験の性質に依存しない得点に変換するために、何らかの方法で得点を調整する必要が出てくる。 得点等化とは、このような状況において、異なる試験を受験した人の得点から試験の性質による影響を排除して、受験者の能力に相応する何らかの共通な得点(尺度点)に変換して比較可能にする操作にほかならない。得点等化にはいくつかの方法が知られているが、項目反応理論と呼ばれる統計的理論に基づく方法が欧米諸国ではよく用いられており、TOEFL のような定評のある試験における等化方法としても用いられている。日本留学試験においても、基本的にはこの方法を用いて得点等化を行う。 項目反応理論では、個々の問題(項目)の統計的性質をもとにして得点等化を行う。あらかじめ、個々の問題の難易度などの統計的性質をあるひとつのモノサシを使って推定する。そして、どのような統計的性質の問題にどの程度正答できるかという情報をもとに、受験者の能力レベルがそのモノサシ上で測定されることになる。その結果、以前に受験したときに比べて受験者の学習が進んだ場合には、たまたま受験する試験の性質に関わらず、尺度点が上がることになる。日本留学試験ではそのような得点等化済みの尺度点が利用されるので、異なる回の得点であってもそのまま比較することができるのである。 |
[ 83] 距離と得点&ポンドの関係
[引用サイト] http://www.usiwakamaru.or.jp/~doraemon/school/tokuten/tokuten.htm
|
1200点を出すには、各距離で何点必要なのか? 30mで300点は、50mで何点に相当するのか? このような距離と得点の関係を知りたいと思っている人は多いと思います。 経験的に50mと、70mは同じような点になることを知っています。男子で1100点を出そうと思うと、50mで280点、30mで320点ぐらいが必要だということも経験を通じて知っています。 方法として、「かってにランキング」に載っている2000年から2003年にかけての4年間のデーターをもとに距離と得点の関係を探ってみました。 30mの得点を基準として、そのときに50mは、70(60)mは、90(70)mは何点だったのかを調べていました。 結果は下の表に示すようになりました。グラフは、黄色の部分が密度が高く、灰色の部分は密度が低くなっています。 平均を取れば良いような気がしますが、そんな簡単な話でもなさそうです。なぜなら、得点の分布が、均等でないからです。下の図のように青い線のように左右対称な分布でなく、赤い線のような分布になっているからです。平均より高い点は出にくいですが、低い点を出すのは簡単だからです。 もう一度密度の分布を描いた図を見てください。黄色より上の幅よりも、下の幅が大きいのが分かると思います。 いろいろ計算しましたが、100人いて、50番目の人の得点を基準にするという考えが最も適していると思ったので、それを基準にして話を進めます。 (100人いて、その真ん中の人の得点を中央値といいます。100人の得点をすべて足して、100で割ったのが、平均値です。100人いて、最も多かった得点を最頻値といいます。今回は中央値を基準に考えます。) (本当は最頻値で考えるのが一番良いのですが、その場合データー数が多くないと誤差が大きく、正確な値が出せません。今回は1万2000以上のデーターをもとにしていますが、これでもデーター数は少ないのです。ですが、今回の分布のは、運が良いことに最頻値と中央値がほとんど同じ値なので、中央値=最頻値と考えました。つまり確率の一番高い得点を基準として考えたのです。) このグラフの結果だけ見ても、まず30mで300点以上出さないと長距離で得点が安定しないと言うことが分かると思います。 これで分かることは、30mで300点なら、男子の場合シングルでおよそ1000点、女子の場合シングルでおよそ1050点になるということです。 各グラフに描いた曲線の式は、Y=aX^b+cで、a、b、cは係数、Yは各距離の得点、Xは30mの得点です。 各距離の合計とシングルの得点が少し違いますが、これは中央値を基準に考えたためで、間違いではありません。 この表からも色々な事が分かります。男子で1100点の標準的な得点配分は、90m 230点、70m 274点、50m 276点 30m 320点だということです。そしてこの得点と比較して大きくズレている場合、たとえば70mで280点が出せるのに50mで270点しか出ないのであれば、実力以外の別の要素がはたらいていると考えたほうが良いと思います。 実際、50mの80cm的と、75mの120cm的が同じ大きさに見えるのですが、120cm的を5m短い距離で打っているのに70mの得点は50mの得点より低くなっていますが、それを表しています。 男子では50mと70mはほとんど同じ得点になりますが、女子では50mと70mを比較すると、70mの方が4〜6点ほど低い点になっています。 この差の原因として考えられるのがポンドの差です。一般的に男子の方が女子よりも強い弓を引いています。このポンドの差が得点に現れたのだと考えられます。 男子と女子の平均的なポンド数の差がどのくらいなのか、明確な資料が無いので分かりませんが、仮に5ポンドから10ポンドの差があるとしましょう。30mで300点の実力の人がポンドを5ポンドから10ポンド上げたとして、50mで約2.5点、70mで約6点上がるだけです。30mで330点の実力の人場合は50mで約4.5点、70mで約9点上がるだけです。 このポンドによる得点差を大きいと見るか小さいと見るかですが、5ポンドから10ポンド弓を強くするのは、かなり大変なことです。強い弓を引くことでの悪い面も考慮に入れると、このポンドアップによる点数アップのメリットは少ないと思います。 ポンド数が高いことによる点数的なメリットは間違いなくありますが、1ポンド上げることで、70mで1点か2点しか利点がないのであれば、無理なポンドを引いてフォームを崩すようなことがあったり、押し手が震えるようであれば、まったくメリットが無いということになります。 逆に男子が5ポンドから10ポンド弓を弱くしても70mで10点得点が下がるだけです。ですから、体力、筋力以上の弓を使うメリットは少ないと思います。無理なく引ける弓、引きこなせる弓を使うのが一番いい気がします。 今までは、30mの得点から他の距離の得点を推測しましたが、今度はトータルの点から各距離の点を調べて見ます。 データー数を増やすために、トータルの得点の前後5点を同得点としました。たとえば995点から1005点までを1000点として考えました。 30mから考えた各距離の得点と、トータルからみた各距離の得点にかなり差があると思いますが、これも間違いではありません。 ではどういうことかというと、30mの得点が同じでも、長距離で得点の良い人はトータルの得点が高くなるからです。 当たり前かもしれませんが、全体の得点は、30mの得点の出来よりも、長距離の得点による影響が大きいからです。 30m以外の距離ですべてが良い得点とはかぎりません。70mがよくても、50mが悪いかもしれません。シングルで得点の高い人は各距離がたまたまよかったので、合計が高いのです。 30mで330点の実力の人は、1200点を出す場合もありますが、1100点しか出ない場合もあります。1200点を出した時、それは長距離の得点が良かったときに決まっているからです。長距離の得点が悪かった時は、1200点は絶対に出ないからです。 もう少し詳しく見てみましょう。女子の場合、1200点以下の場合は30mから推測した得点と比較して長距離の得点が低いです。逆に1200点以上では長距離の得点が高くなっています。 男子の場合、1150点以下の場合は30mから推測した得点と比較して長距離の得点が低く、1150点以上で長距離の得点が高くなっています。 面白いことに、合計点からみた各距離の変化は、ほとんど直線的に変化します。下のグラフを参照してください。 どちらの得点を信じたらいいのか? 疑問を持つ人も多いと思います。30mの得点から推測した各距離の得点は、その人の実力、その距離で出すことが可能な得点を表していると考えることが出来ます。30mの実力が上がれば、長距離の得点が飛躍的に上がることが分かります。 一方、合計点から推測した各距離の得点は、目標得点に必要な各距離の得点を表していると考えることが出来ます。 今回の30mから考えた各距離の得点は平均点ではなくて、その点を出すのが確率的に高いという得点だと言うこと。 「かってにランキング」に載っている記録を資料にした、ということは、女子なら70m、男子なら90mを試合で打てるレベルの人だと言うことです。 弱い弓を引いている初心者が、30mで300点以上出したとしても、70mで240点以上出るということにはならないということです。 当然ながら、雨の日の試合、風の日の試合、それらすべての試合の得点を資料にしています。条件が一定であれば、得点の分布はもう少し小さくなると思います。 得点の資料はありますが、引いている弓のポンド数の資料が無いので、点の高い人も、低い人も同じポンドとして考えています。 そもそも点の高い人は強いポンドを引いている。というのであれば、ポンドを上げることのメリットに関する考え方は変わってきます。 練習が少ない人は弱い弓、練習の多い人は強い弓という傾向があるのであれば、点数は弓の強さの問題ではなくて、練習量の問題になります。 |
[ 84] α係数と(標準)因子得点
[引用サイト] http://www.juen.ac.jp/psych/nakayama/factor.html
|
今年(2002)の修論中間発表を聞いていて,気になったことが一つあります。それは,因子分析の後のデータの扱いについてです。因子分析を行って,単純因子構造を求めるために,項目の選択を行う。そして最終的に出てきた因子を説明するのに,負荷量.4以上の項目を四角で囲んで表示し,α係数を求める。そしてその後の分析のために,因子得点(標準因子得点)を算出する。これはちょっと手続きとしておかしいのです。 なぜおかしいかというと,α係数を求めたり四角で囲むのは,項目の素点を単純に合計して尺度得点を算出するときのやり方であって,因子得点で分析するなら,こういう手続きは不要だし不適切だからです。 今,30項目の質問紙があったとして,因子分析の結果3因子が抽出されたとしましょう。このとき,因子1に高い負荷量を示す項目だけを集めて合計すれば,因子1の性質とおおむね対応した得点が得られるだろうと考えるのが,「合計得点」の考え方です。つまりこれは,因子1の「近似値」を求めているわけです。 このとき,ある項目が因子1にも因子2にも高い負荷量を示していれば,合計得点を求めるときには両方の因子にこの項目を加算することになります。すると,因子1の得点と因子2の得点とは,ある程度相関が高くなってしまいます。同じ得点が両方に入っているわけだから当然ですね。因子分析の目的は,お互いに独立な(相関のない)因子を抽出することですから,こういう相関はマズいのです。そのため,厳密に単純構造を追求し,多重負荷がなく各因子を構成する項目がはっきり分離しているということを,最終的に報告する必要があるのです。枠で囲って,この項目はこの因子に属する項目ですよ,他の因子とは無関係ですよ,と示すわけです。 またα係数は,そうして選択した,たとえば因子1を構成する10項目が,どれくらい単一の内容を斉一的に測定しているかを示す係数です。この値が高ければ,合計得点が何かしらまとまりのある特性を測っていると言うことができます。値が低ければ,これら10項目が測っているものがそれぞれバラバラである,ということになります。だからこの数値は,30項目のうち因子1を構成する10個の項目が,ある程度まとまりがいいと言えるかどうか,したがってそれらの素点をそのまま加算して,「意味のある」得点が作れるのかどうかを,間接的に示していると言えます。 因子得点の考え方はこれとはまったく違います。因子得点は,因子1の得点を求めるのに30項目すべての項目を用います。因子2も因子3も同様です。では何がちがうかといえば,因子得点では各項目の得点にそれぞれ異なる重みづけを与えて合計します。それはたとえば,入試の各科目成績に傾斜配点をかけるようなものです。国文科なら国語の得点を2倍し理科は1/4にするとか,物理学科なら理科と数学を4倍するというように,因子ごとに重みづけを変えて,すべての項目の得点を加算しています。(ちなみに,「合計得点」に今の入試を当てはめると,国文科は国語・英語・日本史の成績だけを使って合否を決める,というようなことになります) それで,この重みを決定しているのが因子分析の因子負荷量です。つまり,全部の項目を使ってはいますが,その因子に対する負荷が小さい項目は重み係数が小さくなるので,合計にあまり影響しないのです。とはいえ,これらの項目も,低いながらも何らかの寄与を各因子に対して持っているはず。「合計得点」の場合は,負荷量の小さい項目からの情報をバッサリ落としてしまうのですが,因子得点では小さい負荷量の項目もそれなりの重みで得点に寄与するので,そのぶん情報量を落とさずに,元の因子の性質をそのまま伝えていると言えるでしょう。 こういう考え方なので,ここでは,多少の多重負荷があっても問題ありません。また,因子の解釈は負荷量の高い項目を3つ4つひろって行えばよく,「この10個が因子1の項目」と線引きする必要もありません。つまり,「合計得点」の時ほど厳密に単純構造を追求しなくてもいいのです。 これで,おわかりいただけたでしょうか。因子得点は30項目すべてを使用するので,.4の負荷量以上の項目を採り上げて枠で囲い,「この10個が因子1を構成する項目だ」と宣言しても何にもならないのです。そして,その10項目の中での内部一貫性を検証するα係数も,まったく意味をなさないのです。また,単純加算した場合の内部一貫性を示すα係数は,重みづけ加算する因子得点には適用できないのです。だから,α係数を求めたあとで因子得点で分析するというのは,途中から分析方針がぐにゃりと曲がっているようなもので,どう見てもヘンなのです。 蛇足ながら,各下位尺度ごとにα係数を求めておいて,同時に全体のα係数を求める,というのも奇妙な手続きです。もし全体でのα係数がじゅうぶん高かったら,それはその質問紙が全体としてまとまりがよいということですから,そもそも因子分析をやる必要がありません。因子分析を実行して,それぞれ意味的に独立した複数の下位尺度があると言いたい(&その下位尺度ごとに分析したい)のなら,下位尺度のα係数を示せばいいのです。全体のαが高いことは,かえって都合が悪い結果になります(項目数が多ければ,どうしたってα係数は高くなります)。 |
