はじめに
こんにちは。(株) 日立製作所の Lumada Data Science Lab. (LDSL)で広報関連の支援をしている日立インフォメーションエンジニアリングの上野由美子です。
2021/11/6に開催されたJDLA Deep Learning for GENERAL 2021#3に合格しました!
LDSLの広報に携わることで、データサイエンティストのみなさんがやっていることを深く知りたいと思うようになり、AI、機械学習、ディープラーニングに興味を持ちました。少しずつAIについて勉強を始めていたので、自分の知識を整理するためにG検定にチャレンジしよう!と思い立ちました。
スポンジのようになんでも吸収する素晴らしい脳みそをおもちの若い方にとってはどうってことないことだと思うのですが、私にとっては、受験勉強が、けっこうキツかったです・・・。その思いのたけをつづってみたいと思います。
G検定って何?
「ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する」ものです。
受験資格 制限なし
-
実施概要 試験時間:120分
知識問題(多肢選択式・220問程度)
オンライン実施(自宅受験)
-
出題範囲 シラバスより出題
-
受験費用
一般:13,200円(税込)
学生:5,500円(税込)
※AI For Everyoneの受講修了証を持っている場合は受験料が30%割引になります。
出典:G検定とは - 一般社団法人日本ディープラーニング協会【公式】 (jdla.org)
勉強する!
テキストを買う
まず、テキストを買います。そもそも自分が仕事でディープラーニングに触れているわけではないので、素人同然のところから始めるわけです。巷に出回っているテキストの良し悪しなど判別できるわけもなく。ここはG検定を実施しているJDLA(一般社団法人 日本ディープラーニング協会)のおすすめテキストを買います。
JDLAの推薦図書は3冊ありました。それぞれネットで情報を仕入れてみると、3冊のうち2冊は「試験には出てこない」という口コミが多かったので、定番のものだけ買いました。
深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版
そして問題集。テキストを読んだだけでは知識が定着しないので、問題集も買います。
こちらもネットの口コミがよさそうな中から選びました。
最短突破 ディープラーニングG検定(ジェネラリスト) 問題集
覚えたことを忘れないようにする(あたり前ですが)
本格的に勉強を始めたのは試験の2か月くらいからでした。
試験日程までの期間でテキスト&問題集のページ数を割り算して、まあ、2回くらい解けばいいか~という気持ちで取り組み始めました。
ある期間、ちょっと用事があって、1週間ほどG検定の勉強から離れて、またG検定に戻ったところ・・・。前にやったとこすっぽり抜けてる!
昔はこんなじゃなかった。年をとって記憶の定着が甘くなったようです。今のやり方じゃだめじゃん、と悟った瞬間でした。(早めに気づけて良かった。)
短期集中でぎゅっと知識を詰め込んで、試験期間までエンドレスで繰り返さないと私の脳みそには入らない。それからは悠長なやり方はストップして、まず速攻でテキストを終わらせ、問題集をひたすら繰り返し、間違った部分はテキストも読み返す、というやり方に移行しました。
覚えることはもちろん、私には「忘れない対策」が必須でした。
つまづきどころ満載
1.略語の洪水に溺れる
まず、略語の洪水に溺れました。ILSVRC、AlexNet、SegNet、U-Net、LSTM、CEC・・・。これ何だっけ?手法?関数名?ネットワークの名前?しょうがないので略語一覧とそれの意味みたいなのをExcelでまとめて印刷して、自分用の略語集を作りました。
2.単語が読めない(笑)
もう、笑うしかないのですが、出てきた単語が読めない。Xavierの初期値って何よ?グザビエ??ザビエル??グザビエの方がかっこいいからグザビエでいくか~。SHRDLU?ショルダー?ではないよな?みたいな感じで。他の人から見ると本当にトホホな状態ですが、私とっては全部「伸びしろ」です。新しいことが少しずつ蓄積されていくのが楽しくて、Google検索を駆使して情報集めをし、こちらもExcelにまとめました。
3.脳みそがオーバーフローを起こして情報がこんがらがる
人工知能とは→人工知能をめぐる動向→機械学習、この辺りまではなんとかキャパ追いついてましたが。ディープラーニングの概要→ディープラーニングの手法あたりから記憶がだんだん怪しくなりました。画像認識?自然言語処理?強化学習だっけ?
私はQiitaの記事に助けられました。特に以下の記事では用語がグループ分けされていて絡まった疑問を解きほぐすのにとても役立ちました。
テキストをとっかかりに少し突っ込んで調べる必要あり
公式テキストを1冊マスターすればシラバスに記載されたすべての構図が分かるわけではなく、テキストでは用語の説明が数行で終わるものもあるので、テキストで触れられている用語について、自分で調べて意味を理解することが必要でした。用語を知っているだけではだめで、それがどういう性質のもので、どんな役割を持っているのか、が分かっていないと本番で苦しみます・・・。
やってよかった。問題集ありがとう。
公式テキストを読み込んで、なんとなく理解したつもりになったのですが、いざ、問題集を解こうとするとモデルや関数等の細かい仕様までは公式テキストには記載されていないので、問題を解くのに情報不足、ということが多々ありました。
今回使った問題集は、解答・解説のページが充実しており、公式テキストで紹介されている手法やネットワークについての捕捉情報が学べたので、私としてはとても役にたちました。テキストに出てきた用語が解答・解説編で図入りで具体的に説明されていたりしたので、文字で覚えるよりも覚えやすかったです。また、問題番号のとなりに「→解答P100」のように対応する解答ページ番号があるのも、間違った問題を振り返るときにとてもありがたかったです。
テキストと問題集で情報を補完して覚える、ということは絶対やってほしいと思います。
ただ、問題集をやりすぎると、「この問題って解答は3だったよな」という感じで、中身ではなく解答番号を覚えてしまい、だんだん意味のない復習になってしまいました。(もしかして、これが過学習というやつ!?)
もう1冊くらい別の問題集を買って、違う切り口で問題に取り組んでもよかったかもしれないと思いました。
公式テキストではあまり触れられていないところ
受験してわかったことですが、2021#3の場合は法律に絡んだ問題も多く出ました。
また、日々成長している分野なので、直近の時事を押さえておくことも重要でした。私が買った公式テキストは2018年に発行されたものなので、当然2018年~2021年までの世の中の動きは載っていないわけです。この期間の特筆すべき出来事などをさらっておく必要があったのだな、と試験を受けたあとに気づきました。
テスト勉強以外でやっていてよかったこと
機械学習に興味があったので、自宅PCにAnaconda3をインストールして、Kaggleのタイタニックを写経していました。
また、無料公開されていたJDLAの下記教育を受講して、Pythonの基礎を学びました。
JDLA期間限定 機械学習のためのPython入門講座 - YouTube
この講座を受講していたおかげで、データを見て特徴量を抽出し、モデルに学習させて、最後に検証する、といった一連の流れが理解しやすかったです。
受験する!
受験にあたり注意点は2つ。
- 事前に動作環境をチェックしておく
- 時間配分に気を付ける
オンライン受験です。自宅PCから受けられます。受験前に環境確認用のページでチェックをしました。(ブラウザのポップアップブロックがかかっていると受験できないなど、注意点がありますので、事前チェック必須です!)
2021#3は2時間で191問でした。ということは、見直しもしたいので、1時間あたり100問以上は解かねばなりません。(ということは30分で50問。15分だと25問。)画面上部にカウントダウンの時計と、こなした問題数が出るのですが、思った以上にスピードが上がらない・・・。迷った問題はチェックをつけておけば後で振り返りできるので、とにかくどんどんこなします。時間切れで問題が解けなかった、ということになるのが一番悔しいのでとにかく進みましょう。
そして何とか191問解き終わり、チェックマークを振り返ろうと問題一覧を確認したらチェックマークの嵐・・・。チェックついてないほうが少ないんじゃない?っていうくらいにチェックだらけ。しまった。絶対わからないヤツはチェックしないで、「ここちょっと怪しいかも」なヤツだけにチェックしておくべきでした。
チェック箇所の見直しをしていたら、50問目あたりでタイムアップ。カウントダウンの時計が0になった時点で「試験終了」になって画面が閉じました・・・。結局全然見直し出来ませんでした。
ちょっとスペックが落ちた私の脳みそでは、振り返りはできませんでした。もう、スピード勝負の試験はキツイです。時間配分、重要です。
やっておけばよかった、と思うこと
模擬試験を受けておけばよかった、と思いました。
テキスト&問題集でいろいろな問題に取り組んでいましたが、これらは「今自分が解いているのは何の問題なのかがあらかじめわかっている」とうアドバンテージがあります。例えば、問題集は章立てが分かれていて、「機械学習の手法ー強化学習」というページでは強化学習の問題しか出ないわけです。問題がシャッフルされた状態で200問解く、という練習をやっておけば、本番で見直しの時間が確保できたのではないかと思いました。
おわりに
G検定は主にAIやディープラーニングの手法の知識を問う試験です。これが取得できたからと言ってすぐにデータ解析の仕事ができるようになるわけではありませんが、AIの活用が広まりつつある社会の中で、必要な知識を体系的に身につけることができます。これから必須になるであろう知識の基礎固めをしておくことは、決して無駄ではない、と思うのです。
G検定の受験をためらっているあなた。データ分析とかまったく無縁だった私が取れたんです。絶対大丈夫です!(笑)