センター数学IIB・統計資料の整理(2008追試験・2009本試験)・問題と解説








  1. (2008追5)













  2. (2009本5)

[解答・解説]
1
2
    • (1)
      選択肢の「ヒストグラム」から、「度数分布表」を復元してみる。
      もちろん、「ヒストグラム」からは10点ごとの「階級値」しかわからないのだから、ここからもとのデータの「平均値」、「中央値」、「標準偏差」などを、正確に計算することは、できない。
      どの「ヒストグラム」がどの「組」に当たるのか?、の見当をつけるには、「人数」、「中央値」で充分だろう。
      • 人数が20人のA、D組では、中央値を求めるには、上から、または下から、第10位と第11位の生徒の平均をとることになる。
        • ヒストグラム(1)では、第10位、第11位ともに、60〜70の階級にいるから、「階級値」で求めると「中央値」は、65のはずである。
        • ヒストグラム(2)では、上から第10位は、50〜60の階級、第11位は、40〜50の階級にいるから、「階級値」で求めると「中央値」は、55と45の平均で、50のはずである。
      • 人数が30人のB、C組では、中央値を求めるには、上から、または下から、第15位と第16位の生徒の平均をとることになる。
        • ヒストグラム(0)では、上から第15位は、70〜80の階級、第16位は、60〜70の階級にいるから、「階級値」で求めると「中央値」は、75と65の平均で、70のはずである。
        • ヒストグラム(3)では、第15位、第16位ともに、70〜80の階級にいるから、「階級値」で求めると「中央値」は、75のはずである。
        もとのデータとの「ずれ」があるから、問題の表の中の「中央値」とは少し異なるが、ほぼ、これで断定できるだろう。



      • さらに確認のために、「標準偏差」について、検討してみよう。
        • 「標準偏差」は「分散」の平方根。
        • 「分散」は、「『偏差』の2乗の平均」であった。
        • どちらも、分布の広がりの度合いを示し、値が大きいほど、広がりが大きい。
        • 特に「標準偏差」の表す数値は、「点数」の単位を持っており、理論上、「無限」のデータを仮定(正規分布)すれば、「平均値プラスマイナス1標準偏差」の範囲に約68パーセントのデータが入ることになる。
        などということを考慮すると、ヒストグラム(1)(2)のようななだらかな分布では「標準偏差」は大きく、ヒストグラム(0)(3)のようなとがった分布では「標準偏差」は小さい、と予想できる。

    • (2)
      A組と予想される「ヒストグラム(2)」をみると、確かに、20〜30に1人、30〜40に4人、計5人の40点未満がいる。これらがすべて一律40点になったのだから、クラス全体の合計点は、その分だけ増え、平均値も大きくなるだろう。
      「最終評価」の平均値は、



    • (3)
      • 上の表で見たように、A組の上から第10位は、50〜60の階級、第11位は、40〜50の階級にいる。
        これら二人の点数の平均が、「中央値」49.0だったわけで、さらにこの二人の「差」が4点であったというから、それぞれの点数をx,yとすれば、

        と、二人の点数がわかってしまった。

      • 欠席者が一人を加えると人数は21人になるから、その「中央値」は、第11位の生徒の点数そのものを採用することになる。

      • 欠席者が75点という、もとの「中央値」よりも高い点数を取ったのだから、もともと第10位だった生徒が第11位となるはずだ。
        だから、もと第10位だった生徒の点数、51点が新しい「中央値」となる。

    • (4)
      • (1)で作った「度数分布表」のB組について、20点区切りにまとめなおしてみると

      • 今度は、各相関図の「横軸」が1回目の成績を表しているのだから、その区分にしたがって、点の個数を読み取っていくと、印刷の加減ではっきりしないものもあるが、

        となるだろう。
        したがって、「相関図(0)」、「相関図(1)」、「相関図(2)」に絞られる。

      • 各相関図の「縦軸」に着目する。
        残念ながら、平均値78.0も、中央値79.0も、どれも当たっていそうで、決め手にならない。

        「標準偏差5.0」を手がかりにするしか、ない。
        (1)で説明したように、
        「標準偏差」の表す数値は、「点数」の単位を持っており、理論上、「無限」のデータを仮定(正規分布)すれば、「平均値プラスマイナス1標準偏差」の範囲に約68パーセントのデータが入ることになる、
        ことを意味するから、この場合、5.0というのはかなり小さな値かなりとがった分布、と考えるべきだろう。
        だから、「相関図(1)」。

    • (5)
      問題文にかかれてあるとおり、「分散s2」は、(2乗の平均)-(平均の2乗)、

      また、「分散s2」は「標準偏差s」の2乗であるから、
      • C組は人数30、平均値70、標準偏差10、

        全員の点数の合計は、


        だから、全員の点数の2乗の平均は、

        全員の点数の2乗の合計は、

      • D組は人数20、平均値60、標準偏差24、

        全員の点数の合計は、


        だから、全員の点数の2乗の平均は、

        全員の点数の2乗の合計は、


      • C,D二組合わせた50人の平均は、

        C,D二組合わせた50人の点数の2乗の平均は、

        したがって、C,D二組合わせた50人の分散は、



  1. 与えられたデータについて、班ごとについても、合計、平均を求める表を作ってみた。



    • (1)
      • 1回目の数学、I班の平均値は、48.0
      • II班の1番目の生徒の数学の点数をAとおくと

    • (2)
      • II班の1回目の数学と英語の相関係数を、「定義式」によって計算する。



        分散    偏差の「2乗」の平均
        標準偏差    分散の平方根
        共分散    偏差の「積」の平均
        相関係数    共分散/(標準偏差の「積」)

        であるから、通常、
        • 「相関係数」を求めるには、
        • 「標準偏差」を求めなければならず、そのためには、
        • 平方根の計算が必要になるのだが、
        センターテストの出題者は電卓がなくても計算できるように、いろいろ工夫をする。

        この問題で、数学と英語の分散が「ともに101.2であった」、というわざとらしい設定もその一つで、
        • 数学の標準偏差が101.2の平方根で、
        • 英語の標準偏差も101.2の平方根なら、
        • その「積」は、ふたたび101.2だから、共分散をこれで割ればよい、
        ことになる。


        数学の分散は、

        英語の分散は、

        共分散は、

        したがって、相関係数は、

        以上を表にまとめると、




























    • (3)
      10人のデータの「中央値」であるから、第5位と第6位の生徒の点数の平均点を採用することになる。
      Bを除く9人のデータでは、
      第5位が50点、第6位が48点。
      • Bが55点より高い得点を取れば、順位がずれて、
        第5位が55点、第6位が55点となり、
        中央値はこれらの平均。52.5
      • Bがちょうど55点なら、第4位5位が同順、
        第4,5位が55点、第6位が50点となり、
        中央値はこれらの平均。52.5
      • Bが48点より低い得点を取れば、そのまま
        第5位が50点、第6位が48点だから、
        中央値はこれらの平均。49.0
      • Bがちょうど48点なら、第6位7位が同順、
        第5位が50点、第6,7位が48点となり、
        中央値はこれらの平均。49.0
      • Bの得点が、これら以外、
        すなわち、54,53,52,51,50,49点のときは、
        それぞれ平均すべき一方が、B自身の得点だから、値が変わってくる。
        詳細は、左の表参照。
      結局、全部で8通りの値がありうることになる。

        1回目の英語のクラス全体の平均が54.0なら、

        となるから、上の表より、中央値は、52.5

    • (4)
      • 2回目の数学の得点について、I班の平均値がII班の平均値より4.6大きいことから、

      • 表には、2回目の数学のクラス全体の平均58.9が与えられているから、
        ここからC,Dの得点を計算できる。参考までに。

        よって、

        こうして、A,B,C,Dすべてわかったので、表にまとめておく。

    • (5)
      • わずか10個のデータであるから、表を見ながら、散布図に該当する「点」が存在するかどうかを、いちいちチェックしていけば、かならず、当たる。

      • グラフから、1回目、2回目ともに、「正の相関」があるといえるが、
        • 1回目の方はかなり「弱い相関」で、
        • 2回目の方はそれよりは「強い相関」、
        ということもわかるだろう。

      • (参考までに、「実用式」で「相関係数」の計算をした表をあげておく)


    • (6)
      • 合計点に変化がないから、平均点は変わらないが、
      • データが平均点のまわりに、より密に集まることになるから、分散は小さくなる。