はじめに
先日、第10回 データサイエンティスト検定リテラシーレベル★(以下DS検定)という資格試験を受けた。CDLEひろしまLT会に参加したところ、他にもDS検定をこれから受けたいという方が何人かいらっしゃったので、参考になればと試験対策についてメモを書くこととする。
学習内容
公式リファレンスブックを読み始めた。
https://gihyo.jp/book/2024/978-4-297-14130-1
G検定を受けたばかりということもあって、ほぼ知っている内容ばかりであったので、この本に収録されている模擬問題をやってみた。引っ掛かる点が二点あったので、それについては注意点で後述する。
合格ラインが8割程度と高いので、「これが苦手だからここは捨てる」という戦略はお勧めしない。といいつつ、第一種の誤りと第二種の誤りのどちらが冤罪かとか、支持度・信頼度・リフト値、正解率・適合率・再現率の定義はどれがどれだか、覚えた次の瞬間忘れている。
学習内容は以下の三つの領域である。
・データサイエンス: 大学初年次程度の線形代数および、簡単な微積分、高校から大学初年次程度のデータの分析・集合・確率の知識、機械学習の基礎
・データエンジニアリング: データを実際に扱うための技術的知識
・ビジネス力: データをビジネスに生かすための知識や倫理
データサイエンスの項目は、幅広くて大変だと思うが、要求される計算自体は難しくない。微積分や偏微分でも、多項式の関数しか出てこない。機械学習については広範な内容が含まれるが、ひととおり理解してほしい所である。
データエンジニアリングの項目は、ITエンジニアであれば、データサイエンティストでなくてもだいたい知っていると思う。それ以外の職種の方はがんばってテキストを読んで、説明が足りない部分は検索して調べてほしい。
ビジネス力の項目は、データ分析は単に数字をいじるだけではなく、なんらかの実際の課題解決に寄与するためにはどのような考え方が必要か、という内容である。
注意点
以下は、実際にDS検定を受験する上で注意喚起が必要と思った内容である。
否定形に注意
試験問題には、正しい選択肢を選べという問題と、正しくない選択肢を選べという問題がある。今年の共通テストの地理Bの問題で言えば、解答番号1の「ニュージーランドに該当する図と牧草地に該当する凡例との組み合わせを、後の①~④のうちから一つ選べ。」は正しい選択肢を選ぶ問題であり、解答番号2の「図3に関する事柄について述べた文として 適当でないもの を、後の①~④のうちから一つ選べ。」は正しくない選択肢を選ぶ問題である。
さて、DS検定では正しくない選択肢を選ぶ問題が、他の試験より高確率で出題される。他の試験では、正しくない選択肢を選ぶ問題は、上記の共通テストのように、問題文の一部を太字にして、「これは正しくない選択肢を選ぶ問題だ」と強調するが、DS検定ではそのような配慮はない。なので、問題がどちらのタイプの問題か、早とちりせずに解答しなければならない。
DS検定の問題は漏らしてはならないので、ガンダムで類似問題を作ってみた。
モビルスーツでないものを一つ選べ
A. ガンダム
B. ザク
C. ギャン
D. ビグザム
という問題に対して「モビルスーツか、よしガンダムだ」と最初の選択肢だけを見てはAと答えてはいけない。最後の選択肢まで見て、Dのビグザムを選ぶべきである。
更に正しくない選択肢を選ぶ問題で、選択肢が否定形を含む問題もある。また類似問題を作ってみた。
機動戦士Gundam GQuuuuuuXの主人公マチュに該当しないのはどれか。
A. 大気圏突入しない
B. 通学に自転車を使わない
C. 人を殺さない
D. シュウジに告白される
マチュはジークアクスで大気圏突入しているので、正解はAである。問題文と選択肢の両方が否定形だと、相当ややこしくなることがわかる。実際、上の選択肢を作っていて、相当混乱した。
箱ひげ図のひげの位置
一般には、箱ひげのひげは、最大のデータと最小のデータの所につける(高校の数学教科書だとそうだ)が、その少し内側につけることもある。統計局のページには、「中には、上下から10%点をひげの両端として描いている箱ひげ図もあります。」と記載されている。
しかし、データサイエンティスト協会の発表したデータサイエンティストスキルチェックリストのDS133によれば、箱の下限-(箱の幅/2)*3に下のひげ、箱の上限+(箱の幅/2)*3に上のひげを書き、ひげの範囲にはまらないデータを外れ値として扱えと書いてある。これはこれで覚えないと、試験では誤答になってしまう。
社会人学生は学生料金で受験できない
G検定は放送大学の学生証を提出すれば学生料金で受験できたが、DS検定を社会人が学生料金で受験することはできない。試験のサイトにはそうは書いていないが、申込ページにはそう書いてある。要注意である。