本記事では、データ分析実務スキル検定の難易度について各項目別に詳細に体験談を交えながら解説していきます。イメージしやすい様に私なりにかみ砕いて解説しようと思います。
体験談をお話しするということで参考として私の受験時の知識レベルを書いておきます。
- 新卒1年目
- 半年ほど独学でデータアナリストを目指して勉強していた。
- 統計検定3級受験済み
- 機械学習についての知識はほとんどなし
- SQLは基本は理解している
- Excelは基本的なことは分かるけどそこまで使ったことない
- Pythonの文法は分かるがPandasは触ったことない
- Rは全く分からない
- TableauなどBIツールを触っていたのでデータ可視化の基本は理解している
- 公式参考書で勉強した
使用した公式参考書はこれです!こちらの参考書の項目にそって解説していきます。
データ分析実務スキル検定とはどのようなものかについては以下の記事で解説しています。
データ分析実務スキル検定とは?難易度や試験内容と実際に受けた感想
データ分析実務スキル検定試験概要と出題項目
簡単にデータ分析実務スキル検定試験についてまとめます。
問題数 | 60 |
試験方法 | CBT |
時間 | 90分 |
合格ライン | 64/97 |
料金 | 11,000円(税込み) |
試験は、データ分析のプロセスに沿って以下のような項目で構成されていました。
※出題されない項目は除いています
- ビジネス課題とKPIツリー
- データ分析の活用とプロジェクト
- データの準備
- リサーチとレポーティング
- 予測モデルを使ったデータ分析
- データ可視化の基本
- 統計学の基本
- 統計手法の基本
- 機械学習の基本
- Excelで出来るデータ分析
- SQLの基本
- Pythonの基本
- Rの基本
以上の中でも7以降の点数配分が大きいです。
各項目の難易度と内容、感想
全体の難易度
まず全体的な難易度ですが、きちんと勉強すれば合格するのは難しくないです。データ分析を始めて半年もしていない私が2週間の学習で合格が出来ました。データ分析に関する学習を行ったことが無い人はもう少し勉強期間が必要でしょう。一個一個のレベルはそこまで高くないですが、データ分析に関する幅広い知識が求められるのでデータ分析に日ごろから触れてない人は勉強のコストは高いかもしれません。
また、「正しいものを全て選べ」など複数解答が求められる問題が多いため曖昧な知識では正解することが出来ません。複数回答の問題について部分点が加算されるかどうかが明示されていないのでその点は謎です。分からない以上複数回答の問題についても正解できるよう学習する必要があります。
ビジネス課題とKPIツリー
この項目では、データ分析をするにあたって必要であるビジネス課題の明確化のために必要な知識が出題されます。ここで明確にしたビジネス課題を解決するためにデータ分析を行っていくイメージです。
出題ポイントをまとめると以下のようになります。
- KPIツリーとは何か、KPIツリーの作成方法
- KPIツリーを活用して、どうやってビジネス課題を明確にするか
KPIツリーについての計算問題が出題されるので、対策が必要ですがパターンが決まっているので対策さえすればサービス問題だと思います!
データ分析の活用とプロジェクト
この項目では、データ分析のプロジェクト全体についての知識が出題されます。分析プロジェクトがどのように行われるかの全体像を把握するイメージです。個人情報保護に関する法律についても出題されます。
出題ポイントをまとめると以下のようになります。
- データ分析プロジェクトの流れと順序
- 分析プロジェクトの各項目の理解
- 個人情報保護に関する理解
個人情報保護の法律に対する問題が出題されますが、暗記する必要はありません。法律の文面は問題文に記載されることが多いので理解の方に重点を置きましょう。
データの準備
この項目では、データ分析プロジェクトにおいてデータを準備する段階についてどのような準備が必要か、準備の際に何を気を付けるべきかを理解しているかが問われます。
出題ポイントをまとめると以下のようになります。
- EDAとは
- データ前処理についての理解
覚えるべきことは少なく、出題の仕方も大体絞られるので対策がしやすい項目だと思いました。
リサーチのレポーティング
この項目では、リサーチとレポート作成についての理解が必要です。アンケートなどを行いその結果をまとめて、レポートを作成する一連の流れとその詳細について出題されるイメージです。
出題ポイントをまとめると以下のようになります。
- リサーチの流れとそのデザイン
- リサーチ結果のスクリーニングのやりかた(結果をまとめる)
- 質的変数と量的変数についての理解
- データの種類ごとの分析方法(質的×質的など)
- 課題の発見
- 施策の評価(サンプルサイズなどの理解も必要)
質的×質的変数ならこの可視化方法をすべきだ…ということが各組合せごとに解説されますが、考えれば理解できることなので覚えるべきことはあまりない項目だと思います。個人的には重点的に勉強する必要はあまりないかと思います。
予測モデルを使ったデータ分析
この項目では、予測モデルとは何か?どうやって作成するのかを理解する必要があります。各予測モデルの詳細については違う項目で出題されます。
出題ポイントをまとめると以下のようになります。
- 予測モデル作成の流れ
- 予測モデル作成にはどのようなステップが必要か
- 各ステップではどのようなことを行うのか
予測モデル全体に対する理解が求められます。のちに出てくる機械学習と密接に関係しているのできちんと理解する必要があります。
しかし、問題自体は予測モデルの各ステップについて理解しておけば全然問題ないです。
データ可視化の基本
この項目では、どんなデータはどうゆう風に可視化すればいいかであったり、こんな可視化方法はNG!といった可視化の基本の理解が必要です。
問題としては、表現したいことに対してどのグラフが適切かを選ぶ問題などが出題されます。
出題ポイントをまとめると以下のようになります。
- どんなデータはどんなグラフが適切か?
- NGな可視化方法について
この項目で出題されるグラフの選定は考えても分からないものも多いので、私は一度スキップして最後に時間が余ったら解くようにしていました。
統計学の基本
この項目では統計学の基本についての範囲です。代表値や四分位範囲など基本的な知識について問われます。その他、オッズ比など発展的な内容も少し含まれているので注意が必要です。この分野では、統計に関する用語の理解が必要だとイメージしてください。
出題ポイントをまとめると以下のようになります。
- 各代表値の理解(最頻値など)
- 正規分布と標準偏差
- (質的×質的変数)など2変数データのまとめ方
- 相関係数
- オッズ・オッズ比
この分野から勉強に本腰を入れる必要があると私は思っています。基本的なことから発展的なことまできちんと理解する必要があります。また、他の項目でも前提知識として使われる知識が多いのできちんと理解をしておきましょう。
統計手法の基本
この項目では、統計をビジネスに適切に活用できるかが問われます。統計手法をビジネス例に当てはめて出題がされ、とても実践的な内容です。推測統計など統計検定2、3級レベルの統計知識を使ってビジネスの課題を解決を試みます。
出題ポイントをまとめると以下のようになります。
- 推測統計への理解
- 確率密度分布
- 仮説検定への理解
- 検定結果の解釈
- 各事例にはどの検定を用いればよいのか
- ABテストへの理解
- 線形回帰
- 回帰式の実装と解釈
私は統計検定3級を取得後の受験だったため前提知識がありましたが、それでも各ビジネス事例に統計を活用するとなると分からない点も多かったです。統計に関する知識がない人は勉強が大変な項目だと思います。
しかし、数学的な理解は求められずビジネスに活用できるかが重要視されているように感じました。どの検定・どの回帰分析をいつ使うべきかを理解しておけば問題自体は解くことが出来ると思いました。
また、Rなどを用いて線形回帰した結果が表示され、その結果を解釈する問題も出題されることが多いです。RやPythonを用いて検定や回帰分析が行われた結果が何を表すのか理解できるようにしましょう!
機械学習の基本
この項目では、各機械学習手法の仕組みとどのように解釈・評価するのかが出題されます。機械学習について知識があまりなかった私は重点的に学習しました。数学的なことも参考書では紹介されていますが、完璧に理解できなくとも機械学習自体の理解さえ出来ていれば問題なく問題は解けます。
出題ポイントをまとめると以下のようになります。
- 各機械学習手法の理解
- 手法の使い分け
- モデルの評価方法計算
真陽性率やF1値などを混同行列から求める問題が出る可能性があるため、計算方法の理解はした方がよいです!
Excelで出来るデータ分析
この項目では、Excelを用いた集計が出来るかが問われます。試験の際はExcelの問題の際のみExcelのウィンドウが表示されて操作を行うことが出来ます。どんなことが出題されるかが明示されているわけでは無いので対策が難しくはありますが、基本的なことを理解しておけば手も足も出ないような問題はないと思います。
出題ポイントをまとめると以下のようになります。
- ピボッドテーブルの使い方
- vlookupやindex,matchなどでの集計
- ヒストグラムなどグラフの描画
よくExcelで使われる関数などを押さえておけば問題はないと思います。データ分析に使いそうな関数や機能を押さえておけばそこまで苦労する問題は出ないと思います。
また、私が受けた際は簡単にも解けるけど力技でも解けるような問題だったのでどうにかはなります。
SQLの基本
この項目では、SQLの基礎が問われます。SQLの基本的な構文が理解出来ていれば問題ないです。SQLを始めて触る人は基本的な構文を理解しましょう。
出題ポイントをまとめると以下のようになります。
- SQLの構文を理解しているか
SQLが一番点数の取りやすい箇所だと私は思っています。join ~ onという構文さえわかっていたらそれで答えられる問題など基本的な問題ばかりです。得点をここで稼ぎましょう!
Pythonの基本
この項目では、Pythonのコードの読解が必要になります。コードを自分で書くことは全くありません。Pythonの基本文法+Pandasライブラリの理解が必要になります。
出題ポイントをまとめると以下のようになります。
- Pythonの基本文法やルールの理解
- Pandasのデータフレーム理解
- Pandasの関数理解
- Pythonでの前処理
- 可視化
出題問題数も多めなのでしっかり対策していきましょう。Pythonの基本的な文法について理解するだけで答えられる問題に加えて、ある程度の長さのコードを読んで何をしようとしているかを読解する問題もあります。Pandasを使ってデータ分析を行い可視化まで行う流れを自分でコードを書いて行ってみるなどの練習が効果的だと思いました。
また、グラフの可視化する際に色を指定するなどカスタムで指定する箇所まで問われる問題もありました。figsize =..はグラフの大きさを指定しているんだな..など細部まで理解する必要があります。
Rの基本
この項目では、Rの基本文法の理解とRのコードの読解は必要になります。主にPythonで学んだことをRで行うためにはどうすればよいかを理解する必要があります。
出題ポイントをまとめると以下のようになります。
- Rの基本文法の理解
- Rでのデータフレームの理解
- Rでの前処理
- 可視化
Pythonと同時にRについても学ばないといけず混乱する箇所だと思います。私も混乱しました。しかし、問題自体はPythonとRが明確に区別されて出題されるので混乱することはありません。コードを読んで何をしようとしているのかを理解出来れば問題ないです!
Rに関しても、細かいところまで出題されるので各関数の理解を曖昧にせずきちんと理解を行いましょう!
まとめ
本記事では、データ分析実務スキル検定の出題範囲の各項目について詳細に解説しました。
各項目をしっかり学習して、合格をつかみ取ってください!学習さえすれば難易度はそこまで高くないので、しっかり準備して本番に臨みましょう!
私が受ける際は、本資格についての情報が少なかったので手探りで受験しました。
今後受ける方にとって有益な情報を提供できたのであれば幸いです。
コメント