Sitting in an Armchair

取るに足らない勉強日記

【受験記】統計検定2級に20時間の勉強でチャレンジ

だいぶ昔の話になりますが、2018年4月頭にCBT方式の統計検定2級に合格しました。
最近、部屋を整理していたらその時の直前1週間分の勉強ノートが出てきて、せっかくなのでその時の勉強の記録を残しておこうと思います。

統計検定2級の概要

統計検定は、統計に関する知識・活用力に関する資格試験です。
その中でも、統計検定2級は大学1・2年で学ぶ基礎的な統計学の知識を問うものになっています。

受験の背景

勉強記を書く前に、その時の状況を書いておこうと思います。
あまり同様の受験をすることは推奨しませんが、同じような背景の方なら理論上合格は可能なのではと。

受験時の統計関連の知識・経験

高校~学部2年までは趣味で公的統計等からグラフを作って遊んでいたので、統計の全容をグラフを作って視覚的に把握することは得意だったと思います。また、学部3年のゼミでは回帰分析を実践してはいました。

一方、フォーマルな知識としては、

  • 高校・学部1年次の統計学の授業・講義:
    話半分に聞いていたため全く覚えていない状態
  • 前年度春学期の計量経済学の授業:履修はしたものの、朝が早くまったく出席できず単位取得を断念=知識としてはほぼゼロ

という形で、 経験としては使ったことはあるものの、感覚的な処理が中心で理論は全くカバーできていない、という状況といってよいと思います。

大体の感覚で言うなら、

  • グラフは知っているものなら大体読める、統計量は平均・分散・標準偏差くらいならわかる
  • 確率分布はベルヌーイ分布(二択)、一様分布くらいなら何とかなるが他はお手上げ
  • 回帰分析は実行・解釈できるが、仮説検定はわからない(信頼区間導出できないとか、そもそも何を検定してるのかわからないとか)

という感じだったと思います。

受験スケジュール

勉強のスケジュールはこんな感じでした。

ひにち 内容
3月29日 申し込み
3月30日-4月4日 公式テキストで勉強
4月5日-7日 なにもせず
4月8日 試験当日・合格

こんな感じで、正味の勉強期間は5日だけでした。さすがに不真面目が過ぎるな?

  • 2018年3月29日
    当時学部3年の春休み、暇だったので*1何か将来に役立つ資格とか取れんかのう、と思いながらggっていたところ統計検定を発見。
    当時計量経済学をほんの少し齧っていたのと、それ以前から統計から見栄えのいいグラフを作って遊ぶことが好きだったので、統計なら役に立つし好きだし普段の勉強の延長線上だなと思って受験を決意しました。
    当日中に参考書を探しに図書館に赴き、現状の知識では1級は難しい&準1級は当時試験が始まったばかりで情報が少なく、勉強法がわからない*2、というところで、その2つは将来課題としてまずは2級を受けてみようと思い立って検索したところ、CBT試験でいつでも受けられる!ことが判明し、何を思ったか直近で予定が空いていた翌週日曜日に予約を入れてしまい、1週間余りの強行日程での受験が決定したという形です。
  • 3月30日~4月4日
    公式テキストを図書館で借り、勉強を始めました。
    この勉強の中身とかは後段書きます。この時期は大学のガイダンス等を受けながら隙間時間を使って、4時間/日くらい勉強していたようです。
  • 4月5日~7日
    大学のサークルの新入生歓迎イベント・引き継ぎ業務などなどが立て続けに発生し、まったく手が付けられませんでした。その割に、試験前日は寝た方がいいだろうと思って日付変わる前に寝た記憶があります。
  • 4月8日
    午後3時台の会場予約だったので、早く起きて練習問題解いてから行こうと思っていたのに寝坊してノータッチで行きました。予定していた勉強範囲の3割もやらないまま受験に至ったので、正直今でもかなり舐めた受験だったなと思います。
    CBT形式は受験終了直後に試験結果を描いたシートが渡されるので、その場で合格が判明しました。

結果

受験後に渡された試験結果のシートはこういう感じのものです。

f:id:v_yezoensis:20200923194205p:plain
統計検定2級受験時の結果

この時の合格点6割(今は合格水準は7割以上とされています)を超える8割というのはいいとして、
下半分にはセクションごとの正答率が示されていますが、最後のセクション「推定・検定・線形モデルの分野」で半分以下しか取れていない一方で、それ以外は全問正解できたようです。

当日の手ごたえとしては、前半の問題は全て自信をもって答えられた一方で、推定・検定のあたりからは勉強不足で全く自信がなかったのを覚えているので、この結果は概ね予想通りです。

第3セクションの54%が全体の20%ということは、第3セクションはこの時はおそらく37点分の配点があったんでしょう。
その他の63点分をすべて自信をもって取れたのが大きかったかな?という感触でした。

勉強内容・合格戦略

ここからは、僕の勉強した(できた)内容を記しておきます。

勉強方法

2級用の公式テキストを読みながら、ノートにまとめながら勉強していました。個人的にはやっぱり読むだけではあまり定着した気がせず、感覚とリンクさせるためにノートにまとめる作業が必須でした。

使用したテキストは公式のものです。それなりに統計学を勉強した今振り返ってみても、2級受験のためとはいえかなり網羅的に統計学の基礎をまとめているように思える、いいテキストです。

特に、装丁や文章が比較的親しみやすいようになっているのが良いポイントだと思います。
確かに内容は他の統計学テキスト*3と比べて少々少な目(薄め?)ではあるんですが、それくらいが2級の勉強にはちょうどいいかなと思います。

テキストの内容

テキストの公式ページには、以下のように目次が示されています。

第1章 データの記述と要約
 1.1 変数の分類
 1.2 量的データの分布
 1.3 分布の特徴を表す指標
 1.4 量的データの要約とグラフ表現
 1.5 質的データの度数分布とグラフ表現
 1.6 2変数データの記述と要約
 1.7 時系列データの記述と簡単な分析

第2章 確率と確率分布
 2.1 事象と確率
 2.2 条件付き確率
 2.3 ベイズの定理
 2.4 確率変数と確率分布
 2.5 期待値と分散
 2.6 モーメント
 2.7 主な離散型確率分布
 2.8 主な連続型確率分布
 2.9 2変数の確率分布
 2.10 標本分布
 2.11 大数の法則中心極限定理

第3章 統計的推定
 3.1 母集団と標本
 3.2 統計的な研究の種類
 3.3 点推定と区間推定
 3.4 1標本問題:1つの母集団の母数に関する推定
 3.5 2標本問題:2つの母集団の母数に関する推定

第4章 統計的仮説検定
 4.1 仮説検定の考え方
 4.2 基本的な仮説検定の構造
 4.3 1標本問題:1つの母集団の母数に関する検定
 4.4 2標本問題:2つの母集団の母数に関する検定

第5章 線形モデル分析
 5.1 線形回帰モデル
 5.2 分散分析モデル

第6章 その他の分析法 正規性の検討,適合度と独立性のχ^2検定
 6.1 正規性の検討
 6.2 適合度の検定
 6.3 独立性の検定

第7章 付録
 7.1 確率分布
 7.2 仮説検定の基礎的理論
 7.3 分散分析の数理
 7.4 多重比較
 7.5 確率分布表の引き方
 7.6 Rの使い方


また、これらの項目は2級の出題範囲表の各項目とも対応しています。(出題範囲表は以下のページに出ています)

なので、このテキストの内容を理解することができれば、問題なく合格が可能だと思います。

勉強した範囲

というわけで、テキストの内容を追ってノートにまとめる形で勉強を進めていました。勉強時間は前述のとおり4時間/日 × 5日間 = 約20時間です。

f:id:v_yezoensis:20200923211937p:plain
こんな感じのノートを作っていました。
丁寧だけど頭に入ってるの?という感じのノートですね

が、ノートを振り返ってみたところ、第2章まででノートが途切れていました。つまり、予定していた全範囲の勉強が全く間に合いませんでした。
あと、第2章までをしっかり勉強しきるのに20時間程度は必要だったかなと思います。

推測される配点

ここで試験結果に記載されていたセクションとも対照してみると、以下のようになると思われます。

セクション テキストの範囲
1変数・2変数記述統計の分野 第1章 データの記述と要約 統計量(平均・分散・相関係数など)、度数分布表とヒストグラム、物価指数など
データ収集・確率・分布の分野 第2章 確率と確率分布 確率変数の定義・性質、主要な確率分布など
推定・検定・線形モデルの分野 第3章 統計的推定
第4章 統計的仮説検定
第5章 線形モデル分析
第6章 その他の分析法 正規性の検討,適合度と独立性のχ2検定
点推定・区間推定、様々な仮説検定、
回帰分析など

見てわかる通り、パッと見て第3セクションが内容が最も重いのがわかります。ただ、前述のとおりこの分野は受験時点では37点分の配点と思われ、増減があったとしてもおそらくセクション間の配点は3:3:4程度なのではないかと推測されます。

とすると、分量としてはそれほど多くない第1~2章をきっちり勉強できれば合格は可能かなと思います。
短い期間の合格を目指すなら、一つの戦略ともなりそうです。

最後に

前半から勉強していた結果全く間に合わなかったのが、結果としては奏功する感じになりました。
とはいえ、統計学として役に立てられる知識としては後半の部分に集約されていると思います。特に、調査のサンプル数設計等に使える仮説検定等の知識について全く勉強せずに合格したとしても、それは有益なのか?という疑問符が付きます。時間があるなら、せっかくいいテキストがあるので、しっかり全範囲を勉強しつつ、次のステップに進むのがいいんじゃないかなと思います。

また、この記事の内容はあくまで2018年4月に受験したCBT試験の受験経験をもとにしたものですので、その後の試験範囲のアップデートなどがあったとしたら、それらに対応しているわけではありませんので、悪しからず。

*1:本来であれば卒論に時間を使うべきところ

*2:2015年春から試験が始まりました。詳細:準1級試験開始のお知らせ|統計検定:Japan Statistical Society Certificate

*3:例えば東大教養学部統計学教室編『統計学入門』久保川『現代数理統計学の基礎』あたりよりはかなり平易だと思います。特に初学者にとっては、まずはこの内容を!という形で読むことになると思いますが、その時に文字が多すぎたり数式が多すぎたりして挫折することはとてもよくある話ですが、そういうことを避けるレベルに適度に内容が濃すぎず、装丁で読みやすさを確保しています。 ただ、最終的にステップアップするには上記2冊レベルが必須になるとは思っています