センター数学IIB・統計資料の整理(2010本試験/2009追試験)・問題と解説











  1. [2010本]








  2. [2009追]












    2010本
    2009追




  1. 2010年本試験
    • (1)  
      第1グループの右手の平均値Aは、例えば「仮平均」を40として計算すると、

      (アイウ)45.0

      20人全員の右手の平均値は、第1グループ10人の合計に第2グループ10人の合計を加えて、20で割ればよいから、

      (エオカ)44.0
      「中央値」
      データを「得点」の高い順(降順)、または、低い順(昇順)に並べたとき、「中央」に来る値。
      1. データ数が「奇数」のとき、
        ちょうど「まん中」があるから、その値。
      2. データ数が「偶数」のとき、
        「まん中」の前後の値の平均。

      20人全員の右手の「中央値」を求めるには、第1グループ、第2グループを通した「順位」を決めなければならない。下の表参照。
      20は偶数だから、その半分の「第10位」46と、その次の「第11位」45の平均、
      (46+45)/2=45.5
      (キクケ)45.5
      「練習用」の表を使って各自確認されたし。

    • (2)  「標準偏差」は「分散」の正の平方根である。問題文中の表には「分散」が掲げてあるが、これは各グループごとの平均値によって計算されたものだから、役に立たない!
      改めて、表を作って計算し直す。20人全員の右手の平均値は、(1)で44と「端数」のない形になったから、ここでは「定義式」を用いることができる。

      「分散」と「標準偏差」
      1. 定義式:「偏差」の2乗の平均
      2. 実用式:(2乗の平均)-(平均の2乗)
        標準偏差=分散の(正の)平方根

      下の表にあるように、「偏差」の2乗の和は、第1グループで300、第2グループで420、合計720、これを人数20で割れば、「分散」。
      (300+420)/20=36
      したがって「標準偏差」は√36=6
      これも「練習用」を用意したから実際に計算されたし。
      20人全体の「中央値」と「分散・標準偏差」の計算
      20人全体の「中央値」と「分散・標準偏差」の計算(練習用)

    • (3)  この問は、「統計学」上とても重要なテーマに触れている。多くの自然現象や社会現象は、もし「サンプル=標本」を十分たくさんとって調査すれば、「正規分布」と呼ばれる複雑な数式、釣り鐘型の曲線で表される「理論値」に従うことが知られている。



      その「正規分布」の理論値によれば、平均値をm、標準偏差をσ(シグマ)とすれば
       m と mσ の間にそれぞれ34.1パーセント
       m σ と m 2σ の間にそれぞれ13.6パーセント
       m 2σ と m 3σ の間に2.1パーセント
       m 3σ の外側にはそれぞれ0.1パーセント
      のデータが存在する、つまり、
      • 平均値のまわり1標準偏差分の間に、約7割、
      • 平均値のまわり2標準偏差分の間に、約95パーセント、
      のデータが収まってしまう「はず」なのだ。

      ここでのデータのように「標本数」がたったの20のような小さなデータ集合では、そんなに「理想的」にはならない。サイコロを数回転がしても例えば「6」が出る回数が必ずしも「6分の1」という「理論値」にならないのと同じだ。
      しかし、どこまでが平均値のまわりに集まった「普通」の値であり、どこからが平均から大きく隔たった「異常値」なのかを判断する参考にはなる。

      さて、平均値M、標準偏差Sに対して、t=1および2のとき、
      M-tSより大きくM+tSより小さい範囲に入っている生徒の人数N(t)」、とは
      • M-Sより大きくM+Sより小さい・・・44-6=38より大きく44+6=50より小さいもの
      • M-2Sより大きくM+2Sより小さい・・・44-2×6=32より大きく44+2×6=56より小さいもの
      をそれぞれ数えればよいことになる。

      以下の表のように、それぞれの範囲に該当するものに○印をつけ、個数を数えればよい。


      (ソタ)12  (チツ)19

    • (4)  第2グループの表の中で空欄になっている、B,C,D,E,Fを埋めなければならない。

      ここから、
      • D=39.5
      • B+C=87
      これ以外にB,Cを決定する条件としては、
      • BがCより大きい
      • 「中央値」が40.5
      • 「分散」が26.25
      の三つがあるが、平均値Dに小数第1位の「端数」があるから、「分散」の計算をするのはかなり困難である。だから、わざわざ問題文でも「分散」のことには触れていない。
      では、「中央値」をどう用いるか?

      左手の握力について、B,Cを除いて順位をつけてみた。8個のデータで「中央値」を求めるなら、第4位の41と第5位の38の平均で
      (41+38)/2=39.5
      となるはずだ。実際の「中央値」は40.5、ということは、10個のデータで第5位が41、第6位が40、つまりより大きいBは41以上で、より小さいCがちょうど第6位の40であると推定できる。
      (41+40)/2=40.5

      というわけで、
      • C=40
      • B=87-40=47
      • E=(49+47)/2=48
      • F=(45+40)/2=42.5
      と決まった。
      (テトナ)39.5  (ニヌ)47  (ネノ)40

    • (5)  20人全員について、
      • 右手と左手の握力の平均値を横軸、
      • 右手と左手の握力の差の絶対値を縦軸、
      とする「相関図」を作る。右側に「練習用」を用意したので、利用されたい。









      平均値平均値



      見ての通り、横軸の数値(握力の平均値)が大きくなっても、縦軸の数値(握力の差の絶対値)はあまり影響を受けず、「右上がり(正の相関)」、「右下がり(負の相関)」いずれの傾向も認められない。だから、ほとんど「無相関」に近いであろうから、相関係数は
      「相関係数」
      「共分散」を、それぞれの「分散」の平方根、すなわち「標準偏差」の積で、割ったもの
      かならず-1と1の間の値であり、
      1. 相関係数の「正負」の符号が、「正の相関」、「負の相関」に対応する。
      2. 相関係数の絶対値が1に近づくほど、「強い」相関、0に近づくほど、「弱い相関」を表す。
      参考までに、コンピュータで相関係数を計算してみた経過を示す。

      したがって、(ハ)(0)  (ヒ)(2)  (フ)(1)
  2. 2009年追試験
    • (1)  
      「中央値」
      データを「得点」の高い順(降順)、または、低い順(昇順)に並べたとき、「中央」に来る値。
      1. データ数が「奇数」のとき、
        ちょうど「まん中」があるから、その値。
      2. データ数が「偶数」のとき、
        「まん中」の前後の値の平均。
      クラス全体のデータ数は、30、偶数であるから、第15番目と第16番目の平均をとることになる。
      表の中の「番号」は、英文法の得点について「昇順」に並べた順にであるから、これを使って、
      第15位:68点
      第16位:72点
      これらの平均、(68+72)/2=70、したがって、(アイウ)70.0

      A群の英文法の得点の平均、例えば50を「仮平均」として計算すると、

      (エオカ)48.2

    • (2)   「87」を「仮平均」として、平均を計算しよう、という意味であろう。C群の英文法の各データから87を引くと、その合計はちょうど10になるから、その平均は1。



      したがって、(キク)1.0、(ケコサ)88.0

      C群の英文法の得点の「分散」を、「定義式」によって、計算する。データがすべて整数値、平均値も、上で見たように整数値になるから、個々の「偏差」を計算してもそれほど煩雑ではないからだ。
      「分散」
      1. 定義式:「偏差」の2乗の平均
      2. 実用式:(2乗の平均)-(平均の2乗)


      したがって、(シスセソ)24.00

      クラス全体の英文法の平均点、

      したがって、(タチツ)68.6
    • (3)  20点ごとに「階級」を区切って、クラス全体の「度数分布表」を作成すると、以下のようになる。
      I=8,J=10,K=10である。
      したがって、(テ)8

      「階級値」とは「階級区分」の上端と下端の平均で、(本当のデータとは異なる値になるが)その「階級」に属する全データが同じ「階級値」をとったと仮定して計算する。
      データ数が十分多ければ、「真の値」との誤差は小さく、計算が楽になるメリットがある。
      こうして、「階級値」による「平均値」を計算した結果が下の表の右から二番目の欄。小数第2位を四捨五入すると、68.7であるから、得点表の「真の値」から計算した68.6との差は、
      |68.6-68.7|=0.1  したがって、(トナ)0.1



      表の一番右側の欄、「累積度数」とは、表の上の方(得点が低い方)から階級までに含まれるデータが、全部でいくつあるかを示す。
      最上段には、「度数」をそのまま記入、その下からは、上段の「累積度数」に、左側のその階級の「度数」を順次たしていけばよい。一番下の欄には、当然、全データ数(この場合30)が入ることになる。下の表参照。
      これを見ると、例えば、40点から60点の階級にいる人は、得点の低い方から順に、第3位から第10位の間にいる、ということが一目でわかる。

      累積度数」の計算方法
      階級度数累積度数
      0-200度数をそのまま0
      20-4020+2=2
      40-6082+8=10
      60-801010+10=20
      80-1001020+10=30

    • (4)  この問題では「累積度数分布表」のヒストグラムをたずねていることに注意を要する。

      もし「度数分布表」のヒストグラム、ならば、左のグラフのように、選択肢(0)となるはずだが、「累積度数分布表」のヒストグラムであるから、右のグラフのように選択肢(1)である。
      • 縦軸が、「度数分布表」なら、もっとも頻度の高い階級の度数、ここでは「10」、
        「累積度数分布表」なら、全データ数の「30」でなければならい。
      • グラフの形状は、「度数分布表」では、「つりがね型」など様々な形をとり得るが、
        「累積度数分布表」では、かならず、「右上がり」の「単調増加」になる。
      したがって、(ニ)(1)

    • (5)  C群の「英文法」の得点から平均値88をひいたものを横軸、「英会話」の得点から平均値87をひいたものを縦軸として、「相関図(散布図)」を作る。



      上の表のデータを用いて、右側の白紙の「練習用」グラフに各自、プロットしてみよう。
      解答練習用




      英文法英文法
      選択肢から正解を選ぶには、「25番」(-2,-10)や「29番」(6,8)のように、集団から飛び抜けた「異常値」に着目するとよい。
      答えは、(ヌ)(1)
    • (6)  データが30件ともなると、相関図にすべてをプロットしてみるのは大変な作業になる。
      ここでも一応練習用を用意したが、実際には、やはり、いくつかの「異常値」に着目して、選択肢から探す。
      解答練習用




      英文法英文法
      クラス全体の「英文法」の平均点は、68.6、「英会話」の平均を計算してみると、
      (58.5+80.4+87.0)/3=75.3
      であるから、相関図の中に、(68.6,75.3)を原点とする座標軸をかきいれてみた。

      御覧の通り、ほとんどのデータが「第1象限」と「第3象限」に集中している。これは「英文法の得点が高い人は、英会話の得点も高く、英文法の得点が低い人は、英会話の得点も低い」、つまり、正の相関が強いことを意味している。
      「相関係数」
      「共分散」を、それぞれの「分散」の平方根、すなわち「標準偏差」の積で、割ったもの
      かならず-1と1の間の値であり、
      1. 相関係数の「正負」の符号が、「正の相関」、「負の相関」に対応する。
      2. 相関係数の絶対値が1に近づくほど、「強い」相関、0に近づくほど、「弱い相関」を表す。

      だから「相関係数」は、正の値で、かつ、かなり1に近い、と思われる。
      したがって、r=0.9、(ヒ)(4)
      むしろ
      • 「第2象限」、すなわち「英文法」は低いが「英会話」は高い人、
      • 「第4象限」、すなわち「英文法」は高いが「英会話」は低い人、
      は「例外的」のようだから、この少数派を数えることにする。
      下の表には、それぞれの平均点より高いものに「○」、低いものに「×」の印をつけてみた。こうして「第2象限」にはわずか3件、「第4象限」には0件、であることがわかった。表中、番号に網掛がかかっているものがそれである。

      したがって答えは、30-3=27で、(ノハ)(27)

      そして、英会話の得点を記入する際に順番を逆にしてしまった、というのなら、元のデータがこれほど「強い・正の相関」をもっていた、すなわち、「英文法のできる人は英会話もできる」ことを示していたのだから、 それをすっかり入れ替わって、「英文法のできる人ほど、英会話ができない」状態を示すことになるだろう。
      「強い・負の相関」になるはずである。参考までに、以下のグラフを作ってみた。

      したがって、(フ)(3)、(ヘ)(0)