【完全独学】データサイエンティスト検定・合格体験記

DS検定

私はデータサイエンティスト検定(リテラシーレベル)を受験し、完全独学で合格しました。

この記事では、完全独学での合格体験記を紹介していきます。

データサイエンティスト検定が気になっている人、受験しようか悩んでいる人、どう勉強していけばよいか困っている人のヒントになれば幸いです。

本ページはプロモーションが含まれています。

データサイエンティスト検定の概要

データサイエンティスト検定(リテラシーレベル)とは、データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力について、見習いレベル(★)の実務能力や知識の証明に加え、数理・データサイエンス・AI教育のリテラシーレベルの実力を有しているかを検定する試験です。

データサイエンティスト協会が主催し、①データサイエンティスト初学者や、②これからデータサイエンティストを目指すビジネスパーソン、③データサイエンティストに興味を持つ大学生や専門学校生などを受験対象者として想定しているようです。

DS検定で身につくこと

  1. データサイエンス力
    情報処理、人工知能、統計学などの情報科学系の知恵を理解し使う力
  2. データエンジニアリング力
    データサイエンスを意味のある形に使えるようにし実装・運用できるようにする力
  3. ビジネス力
    課題背景を理解した上でビジネス課題を整理し解決する力

データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についてそれぞれ初歩的な知識を身に付けることができます。

試験概要

・試験時間:90分
・出題形式:多肢選択式
・出題数:90問程度
・全国のテストセンターでCBT方式により実施
・年2回開催(2023年は6⽉、11⽉)
・費⽤:⼀般:11,000円(税込)学⽣:5,500円(税込)
・合格率:概ね50%前後
・合格ラインの目安:正答率79~80%

①CBT方式のため受験期間中に自分で試験日を決めてテストセンターで受験できること、②一問あたり1分程度の解答時間しかないことが特徴といえます。

試験シラバス

データサイエンティスト協会が公開している「アシスタント・データサイエンティスト(見習いレベル:★)」と、数理・データサイエンス教育強化拠点コンソーシアムが公開している「数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム」を総合した内容となっています。

①アシスタント・データサイエンティスト(見習いレベル:★)

  1. データサイエンス力
    統計数理基礎、線形代数基礎、微分・積分基礎、集合論基礎、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、回帰・分類、評価、推定・検定、グルーピング、性質・関係性の把握、因果推論、サンプリング、データクレンジング、データ加工、特徴量エンジニアリング、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、時系列分析、機械学習、深層学習、自然言語処理、画像認識、映像認識、音声認識、パターン発見
  2. データエンジニアリング力
    システム企画、システム設計、アーキテクチャ設計、クライアント技術、通信技術、データ抽出、データ収集、データ構造の基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、前処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、拡張プログラミング、アルゴリズム、分析プログラム、SQL、ITセキュリティの基礎知識、攻撃と防御手法、暗号化技術、認証、ソース管理、AutoML、MLOps、AIOps
  3. ビジネス力
    ビジネスマインド、データ・AI倫理、コンプライアンス、契約、MECE、構造化能力、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、AI活用検討、KPI、スコーピング、データ入手、分析アプローチ設計、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント

②数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム

  1. 社会におけるデータ・AI利活用
    社会で起きている変化、社会で活用されているデータ、データ・AIの活用領域、データ・AI利活用のための技術、データ・AI利活用の現場、データ・AI利活用の最新動向
  2. データリテラシー
    データを読む、データを説明する、データを扱う
  3. データ・AI利活用における留意事項
    データ・AIを扱う上での留意事項、データ・AIを守る上での留意事項

Di-Lite推奨資格

経済産業省がオブザーバーとなっている「デジタルリテラシー協議会」がすべてのビジネスパーソンが学ぶべきデジタルリテラシー「Di-Lite」を定義しており、その中の推奨資格として「データサイエンティスト検定」を挙げています。

今までは「IT人材」と「非IT人材」が区別されていましたが、これからは全てのビジネスパーソンが「デジタル人材」として成長することが期待されています。「作る人」「使う人」「企画する人」「判断する人」の全てがデジタル人材であることが求められるビジネス環境になってきていると言えます。

「Di-Lite」は現在、「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」の3領域として定義され、その学習すべき範囲として、「ITパスポート試験」「G 検定」「データサイエンティスト検定」の3つの試験が推奨されています。

Di-Lite領域

事前知識

中小企業診断士、基本情報技術者、応用情報技術者、G検定を取得しています。ITの知識レベルやリテラシーについては一般的な社会人より高めだと思います。

データサイエンティストとしての実務経験はありませんが、趣味でPythonを勉強しています。また、直前でG検定を受験しているため、事前知識という面ではかなりアドバンテージがある状態です。

勉強期間

試験期間である11月に向けて業務が繁忙期を迎えるため、余裕を持っておよそ2か月前の9/16から勉強を始めました。
しかしながら、思った以上に勉強時間を確保できず、トータルで約50時間程度の勉強時間でした。

なお、合格するために必要な勉強時間の目安は初心者150時間、経験者50時間程度と言われています。

使用教材


合格対策 データサイエンティスト検定[リテラシーレベル]教科書(いわゆる緑本)

 

最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版(いわゆる青本)

 

徹底攻略データサイエンティスト検定問題集[リテラシーレベル]対応 徹底攻略シリーズ(いわゆる黒本)

勉強法

教材②の青本は公式テキストですが、最初の通読本としてのやり辛さを感じたため、まずは教材①の緑本を通読することにしました。

教材①の緑本を読み進めながら、節末の問題を解いていきました。他資格の勉強方法と同様、テキストを読んでインプットしたら、該当する箇所の問題を解いてアウトプットを必ず行い、インプットとアウトプットを必ずセットで行うようにしました。

教材①の緑本を1周した後に、教材②の青本を読みながら、教材③の黒本を解いていきました。早めに勉強を開始した割に勉強時間を確保できず、教材①~③をそれぞれ1周し終えたのは試験日2週間前の11/11でした。

1周目の模擬試験問題では正答率が8割前後と合格ライン上だったため、残り2週間で2周目に突入しました。

試験日直前の祝日にまとまった勉強時間を確保できたことで、なんとか2周回すことができました。2周目の正答率は9割程度まで達成できたため、これなら合格を狙えると感じました。

緑本 模擬試験問題
1回目 67/90 74.4%
2回目 81/90 90.0%

青本 模擬試験問題
1回目 38/45 84.4%
※2回目は時間が足りず解けませんでした。

黒本 模擬試験問題
1回目 75/90 83.3%
2回目 82/90 91.1%

本番

11/25に自宅近くのテストセンターにて受験しました。

受付で本人確認書類を提出し本人確認を行った後、割り当てられたパソコンで試験開始です。

電卓は持ち込み不可ですが、画面上に電卓機能を表示させることができます。

受験後の感想

概ねテキストや問題集の模擬試験問題と似たような出題内容でしたが、本番の方が問題の文章量が多いと感じました。
テキストや問題集は時間に余裕を持って解答し終えることができましたが、本番では時間にあまり余裕がなく、最後に5分程度の時間しか残りませんでした。

また、比較的新しい試験だからというのもあるかと思いますが、日本語が一部不自然な問題もあり、受験者側で意図を汲んで解答しなければならないものもありました。

教材に関しては、教材①の緑本が分かりやすかったです。教材②の青本は公式テキストですが、通読して全体像を理解していくというよりも、理解が足りない箇所について調べる辞書的な使い方が向いていると感じました。教材③は問題が豊富に用意されており、出題範囲がカバーされていると感じました。

なお、教材②は当初は誤字脱字が散見されたようなので、最新の版数・刷数を意識して購入された方がストレスなく読めます。私が購入したテキストは最新版でしたので、誤字脱字は修正されていました。

今までに取得してきたIT系の資格と出題範囲が被る部分も多く、実務経験はゼロですが勉強時間が少ない中でかなりのアドバンテージになったと思います。

結果

試験終了後、結果レポートが印刷されます。
総合スコアは83.3%と合格水準とされる80.0%をギリギリ上回る結果でした。

総合スコア 83.3%
1.データサイエンス 82.2%
2.データエンジニアリング 76.0%
3.ビジネス 95.0%

【1/20追記】2か月後の1/11に正式な合格発表があり、総得点375点で合格でした。

総得点 375点
1.データサイエンス 185点
2.データエンジニアリング 95点
3.ビジネス 95点

DS検定結果レポート

DS検定スコアシート