センター数学IIB・統計資料の整理(2008追試験・2009本試験)・問題と解説
(2008追5)
(2009本5)
[解答・解説]
1
2
(1)
選択肢の「ヒストグラム」から、「度数分布表」を復元してみる。
もちろん、「ヒストグラム」からは10点ごとの「階級値」しかわからないのだから、ここから
もとのデータ
の「平均値」、「中央値」、「標準偏差」などを、
正確に
計算することは、できない。
どの「ヒストグラム」がどの「組」に当たるのか?、の見当をつけるには、「
人数
」、「
中央値
」で充分だろう。
人数が20人のA、D組では、中央値を求めるには、上から、または下から、第10位と第11位の生徒の平均をとることになる。
ヒストグラム(1)では、第10位、第11位ともに、60〜70の階級にいるから、「階級値」で求めると「中央値」は、65のはずである。
ヒストグラム(2)では、上から第10位は、50〜60の階級、第11位は、40〜50の階級にいるから、「階級値」で求めると「中央値」は、55と45の平均で、50のはずである。
人数が30人のB、C組では、中央値を求めるには、上から、または下から、第15位と第16位の生徒の平均をとることになる。
ヒストグラム(0)では、上から第15位は、70〜80の階級、第16位は、60〜70の階級にいるから、「階級値」で求めると「中央値」は、75と65の平均で、70のはずである。
ヒストグラム(3)では、第15位、第16位ともに、70〜80の階級にいるから、「階級値」で求めると「中央値」は、75のはずである。
もとのデータ
との「ずれ」があるから、問題の表の中の「中央値」とは少し異なるが、ほぼ、これで断定できるだろう。
さらに確認のために、「標準偏差」について、検討してみよう。
「標準偏差」は「分散」の平方根。
「分散」は、「『偏差』の2乗の平均」であった。
どちらも、分布の
広がりの度合い
を示し、値が大きいほど、広がりが大きい。
特に「標準偏差」の表す数値は、「点数」の単位を持っており、理論上、「無限」のデータを仮定(正規分布)すれば、「平均値プラスマイナス1標準偏差」の範囲に約68パーセントのデータが入ることになる。
などということを考慮すると、ヒストグラム(1)(2)のような
なだらかな分布
では「標準偏差」は大きく、ヒストグラム(0)(3)のような
とがった分布
では「標準偏差」は小さい、と予想できる。
(2)
A組と予想される「ヒストグラム(2)」をみると、確かに、20〜30に1人、30〜40に4人、計5人の40点未満がいる。これらがすべて一律40点になったのだから、クラス全体の合計点は、その分だけ増え、平均値も大きくなるだろう。
「最終評価」の平均値は、
(3)
上の表で見たように、A組の上から第10位は、50〜60の階級、第11位は、40〜50の階級にいる。
これら
二人の点数の平均
が、「中央値」49.0だったわけで、さらにこの二人の「差」が4点であったというから、それぞれの点数を
x
,
y
とすれば、
と、二人の点数がわかってしまった。
欠席者が一人を加えると人数は21人になるから、その「中央値」は、第11位の生徒の
点数そのもの
を採用することになる。
欠席者が75点という、もとの「中央値」よりも高い点数を取ったのだから、もともと第10位だった生徒が第11位となるはずだ。
だから、もと第10位だった生徒の点数、51点が新しい「中央値」となる。
(4)
(1)で作った「度数分布表」のB組について、20点区切りにまとめなおしてみると
今度は、各相関図の「横軸」が1回目の成績を表しているのだから、その区分にしたがって、点の個数を読み取っていくと、印刷の加減ではっきりしないものもあるが、
となるだろう。
したがって、「相関図(0)」、「相関図(1)」、「相関図(2)」に絞られる。
各相関図の「縦軸」に着目する。
残念ながら、平均値78.0も、中央値79.0も、どれも当たっていそうで、決め手にならない。
「標準偏差5.0」を手がかりにするしか、ない。
(1)で説明したように、
「標準偏差」の表す数値は、「点数」の単位を持っており、理論上、「無限」のデータを仮定(正規分布)すれば、「平均値プラスマイナス1標準偏差」の範囲に約68パーセントのデータが入ることになる、
ことを意味するから、この場合、5.0というのは
かなり小さな値
、
かなりとがった分布
、と考えるべきだろう。
だから、「相関図(1)」。
(5)
問題文にかかれてあるとおり、「分散
s
2
」は、(2乗の平均)-(平均の2乗)、
また、「分散
s
2
」は「標準偏差
s
」の2乗であるから、
C組は人数30、平均値70、標準偏差10、
全員の点数の合計は、
だから、全員の点数の2乗の平均は、
全員の点数の2乗の合計は、
D組は人数20、平均値60、標準偏差24、
全員の点数の合計は、
だから、全員の点数の2乗の平均は、
全員の点数の2乗の合計は、
C,D二組合わせた50人の平均は、
C,D二組合わせた50人の点数の2乗の平均は、
したがって、C,D二組合わせた50人の分散は、
与えられたデータについて、班ごとについても、合計、平均を求める表を作ってみた。
(1)
1回目の数学、I班の平均値は、48.0
II班の1番目の生徒の数学の点数をAとおくと
(2)
II班の1回目の数学と英語の相関係数を、「定義式」によって計算する。
分散
偏差
の「2乗」の平均
標準偏差
分散
の平方根
共分散
偏差
の「積」の平均
相関係数
共分散
/(
標準偏差
の「積」)
であるから、通常、
「相関係数」を求めるには、
「標準偏差」を求めなければならず、そのためには、
平方根の計算が必要になるのだが、
センターテストの出題者は電卓がなくても計算できるように、いろいろ工夫をする。
この問題で、数学と英語の分散が「ともに101.2であった」、というわざとらしい設定もその一つで、
数学の
標準偏差
が101.2の平方根で、
英語の
標準偏差
も101.2の平方根なら、
その「積」は、ふたたび101.2だから、共分散をこれで割ればよい、
ことになる。
数学の分散は、
英語の分散は、
共分散は、
したがって、相関係数は、
以上を表にまとめると、
(3)
10人のデータの「中央値」であるから、第5位と第6位の生徒の点数の平均点を採用することになる。
Bを除く9人のデータでは、
第5位が50点、第6位が48点。
Bが55点より高い得点を取れば、順位がずれて、
第5位が55点、第6位が55点となり、
中央値はこれらの平均。52.5
Bがちょうど55点なら、第4位5位が同順、
第4,5位が55点、第6位が50点となり、
中央値はこれらの平均。52.5
Bが48点より低い得点を取れば、そのまま
第5位が50点、第6位が48点だから、
中央値はこれらの平均。49.0
Bがちょうど48点なら、第6位7位が同順、
第5位が50点、第6,7位が48点となり、
中央値はこれらの平均。49.0
Bの得点が、これら以外、
すなわち、54,53,52,51,50,49点のときは、
それぞれ平均すべき一方が、B自身の得点だから、値が変わってくる。
詳細は、左の表参照。
結局、全部で8通りの値がありうることになる。
1回目の英語のクラス全体の平均が54.0なら、
となるから、上の表より、中央値は、52.5
(4)
2回目の数学の得点について、I班の平均値がII班の平均値より4.6大きいことから、
表には、2回目の数学のクラス全体の平均58.9が与えられているから、
ここからC,Dの得点を計算できる。参考までに。
よって、
こうして、A,B,C,Dすべてわかったので、表にまとめておく。
(5)
わずか10個のデータであるから、表を見ながら、散布図に該当する「点」が存在するかどうかを、いちいちチェックしていけば、かならず、当たる。
グラフから、1回目、2回目ともに、「正の相関」があるといえるが、
1回目の方はかなり「弱い相関」で、
2回目の方はそれよりは「強い相関」、
ということもわかるだろう。
(参考までに、「実用式」で「相関係数」の計算をした表をあげておく)
(6)
合計点に変化がないから、
平均点は変わらない
が、
データが平均点のまわりに、
より密に集まる
ことになるから、
分散は小さく
なる。