資格男ボキオの部屋

「歌をメインに外国語をまなブログ」のサブチャンネルです。資格や経済について語ります。

【BK052】統計検定:前回紹介した統計学の教科書を読み終えました 〜 3級にも対応できそうです

f:id:HikkiMorry:20210509101320j:plain

 ボキオです。。

 

 前回のブログ【BK051】で6月20日実施の統計検定3級4級に申し込んだことと、教材として「世界一カンタンで実践的な文系のための統計学の教科書」を購入したことを報告しました。

hikkimorry.hatenablog.jp

 

 今回は、本書で学んだ内容と過去問に挑戦した結果を報告します。

 なお用語については一部本書とは表現を変えています。また、英語を追記しています。

 

1.本書で学んだ内容

 

(1)データの代表値について

代表値(representative value):所与のデータの分布を1個の数値で代表させるときの値。平均値中央値最頻値などがある。

平均値(mean/average):全てのデータを足してデータ数で割ったもの。

中央値(median):データを小さい順に並べた順位が中央となる値(データ数が偶数の場合は、中央順位2個の値の平均をとる)。

最頻値(mode):最も頻繁に現れる値(データ)。

 →総務省が発表する世帯あたり貯蓄現在高の、平均約1,800万円には違和感があるが、一部の大金持ちが平均を引き上げているためで、中央値(約1,000万円)と最頻値(100万円未満)を併記することで全体の傾向が明確になる。

 

(2)分散と標準偏差

分散(variance):データの散らばりの度合いを表す値。それぞれのデータと平均値の差(偏差)を二乗し平均を取る。

標準偏差(standard deviation):分散の平方根(square root)。標準偏差と平均値で正規分布を描ける。

正規分布(normal distribution):平均値、中央値、最頻値が一致する分布。

標準正規分布:平均値をゼロ、標準偏差を1とした場合の正規分布

 →偏差値と知能指数は標準正規分布と同じ考え方。

 

(3)正規分布の枠内に入るデータ量(率)

・平均値 ± 標準偏差 = 68.3%

・平均値 ± 標準偏差X2 = 95.5%

・平均値 ± 標準偏差X3 = 99.7%

 

(4)相関係数(correlation coefficient)

正の相関:データの分布が右肩上がり(最大+1)

・相関なし:データの分布に傾向がなく円状となる(ゼロ)

負の相関:データの分布が右肩下がり(最小-1)

 →因果があれば相関があるが、相関があっても因果があるとは限らない

 

 

2.過去問を解いた結果

 

 上記「統計学の教科書」で学んだ知識をベースに、2019年11月実施の統計検定3級の過去問を解いてみました。

 結果は、30問中24問と正解率は80%でした(時間は測っていません)。

 3級では上記用語の理解が必要なものの、公式の暗記や難しい計算は必要ないとの印象でした。

 

 以上の結果から、現在の知識で残りの過去問を解けば、合格レベルに達するのではと思います。

 また時間があれば、前回の報告時点では難しいそうだった、公式テキスト「データの分析」日本統計学会編)を読んで、2級の準備としたいです。

 

 以上、6月20日受験が楽しみになってきたボキオでした。。  

世界一カンタンで実戦的な文系のための統計学の教科書 [ 本丸諒 ]

価格:1,650円
(2021/6/6 15:03時点)
感想(1件)

 

データの分析改訂版 日本統計学会公式認定統計検定3級対応 [ 日本統計学会 ]

価格:2,420円
(2021/6/6 15:04時点)
感想(4件)