ボキオです。。
前回のブログ【BK051】で6月20日実施の統計検定3級と4級に申し込んだことと、教材として「世界一カンタンで実践的な文系のための統計学の教科書」を購入したことを報告しました。
今回は、本書で学んだ内容と過去問に挑戦した結果を報告します。
なお用語については一部本書とは表現を変えています。また、英語を追記しています。
1.本書で学んだ内容
(1)データの代表値について
・代表値(representative value):所与のデータの分布を1個の数値で代表させるときの値。平均値、中央値、最頻値などがある。
・平均値(mean/average):全てのデータを足してデータ数で割ったもの。
・中央値(median):データを小さい順に並べた順位が中央となる値(データ数が偶数の場合は、中央順位2個の値の平均をとる)。
・最頻値(mode):最も頻繁に現れる値(データ)。
→総務省が発表する世帯あたり貯蓄現在高の、平均約1,800万円には違和感があるが、一部の大金持ちが平均を引き上げているためで、中央値(約1,000万円)と最頻値(100万円未満)を併記することで全体の傾向が明確になる。
(2)分散と標準偏差
・分散(variance):データの散らばりの度合いを表す値。それぞれのデータと平均値の差(偏差)を二乗し平均を取る。
・標準偏差(standard deviation):分散の平方根(square root)。標準偏差と平均値で正規分布を描ける。
・正規分布(normal distribution):平均値、中央値、最頻値が一致する分布。
・標準正規分布:平均値をゼロ、標準偏差を1とした場合の正規分布
(3)正規分布の枠内に入るデータ量(率)
・平均値 ± 標準偏差 = 68.3%
・平均値 ± 標準偏差X2 = 95.5%
・平均値 ± 標準偏差X3 = 99.7%
(4)相関係数(correlation coefficient)
・正の相関:データの分布が右肩上がり(最大+1)
・相関なし:データの分布に傾向がなく円状となる(ゼロ)
・負の相関:データの分布が右肩下がり(最小-1)
→因果があれば相関があるが、相関があっても因果があるとは限らない
2.過去問を解いた結果
上記「統計学の教科書」で学んだ知識をベースに、2019年11月実施の統計検定3級の過去問を解いてみました。
結果は、30問中24問と正解率は80%でした(時間は測っていません)。
3級では上記用語の理解が必要なものの、公式の暗記や難しい計算は必要ないとの印象でした。
以上の結果から、現在の知識で残りの過去問を解けば、合格レベルに達するのではと思います。
また時間があれば、前回の報告時点では難しいそうだった、公式テキスト「データの分析」(日本統計学会編)を読んで、2級の準備としたいです。
以上、6月20日の受験が楽しみになってきたボキオでした。。
世界一カンタンで実戦的な文系のための統計学の教科書 [ 本丸諒 ] 価格:1,650円 |
データの分析改訂版 日本統計学会公式認定統計検定3級対応 [ 日本統計学会 ] 価格:2,420円 |