Data Analysis (Part 1)
データを 階級(区間)ごとに分けて、それぞれの 度数(データの個数)をまとめた表を 度数分布表 という。
| 階級(点) | 度数(人) |
|---|---|
| 0〜20 | 3 |
| 20〜40 | 8 |
| 40〜60 | 12 |
| 60〜80 | 10 |
| 80〜100 | 7 |
| 計 | 40 |
各階級の 真ん中の値 を 階級値 という。
階級「20〜40」の階級値 =
データを代表する値:
| 代表値 | 意味 |
|---|---|
| 平均値 | すべてのデータの合計 ÷ データの個数 |
| 中央値(メジアン) | データを小さい順に並べたとき真ん中の値 |
| 最頻値(モード) | 度数が一番多い階級の階級値 |
データの個数が偶数のとき、中央値は真ん中の2つの値の平均。
階級「40〜60」の階級値は?
(40+60) ÷ 2 = 50
階級の両端の平均が階級値。
データ 3, 5, 7, 9, 11 の中央値は?
7
5個のデータの真ん中(3番目)。
度数が一番多い階級の階級値を何という?
最頻値(モード)
一番よく出てくる値のこと。
度数分布表とヒストグラム
データを階級に分けて数える。棒グラフとの違いは?
確認問題
テスト点数を10点刻みで分類。60-70点が8人、70-80点が12人。相対度数が大きいのはどちら?