Help us understand the problem. What is going on with this article?

[レベル低め]機械学習・ディープラーニング入門者がG検定を受けてみた

はじめに

この記事は入門者、初心者向けです。
さらに数式や難しい技術の話などは一切出さないつもりです。

そのため、エンジニアでこれから機械学習・ディープラーニングを学びたい人はもちろん、
G検定を目指す非エンジニアにも読んでいただける内容(読みやすい、読みにくい、得るものの有無に関わらずw)になっていると思っています。

AIって漠然としていて、しかも難しそうなイメージで、
何から手をつけたらいいのか考える時間が結構あったので、同じような境遇の方々の力に少しでもなれればと。

筆者スペック

  • エンジニア歴7年
    • SI企業5年、ベンチャー界隈2年ほどのOSS系のWEB開発を中心に幅広くフルスタックに
    • 現在スタートアップ企業のWEBエンジニア(非AI系)
  • AI歴0年
    • AI?あ、あのそこそこ美味しそうなやつね。
    • 機械学習?なんか記事で何回か読んだことある。
    • ディープラーニング?ググったことある。機械学習の一種でしょ?

AIについては上記くらいのエンジニアとして少しググったことある程度なので、ほぼ知識なし。AI弱者ってやつです。

とりあえずG検定を受けてみた

4回目にあたるJDLA Deep Learning for GENERAL 2019 #1 を受験しました。

受ける人によっても色々目的があると思いますが、自分は

  • AI知識で認定レベルの基礎はどのくらいの物なのか知る
  • AI知識学習の難しさを知る

の2つに絞って受験勉強を行なって受験しました。
結果はまだ出ていませんが、取得することが目的ではないので受かってても落ちてても(もちろんショックではあるが)あまり気にしません。

ホームページから引用すると

概要:ディープラーニングを事業に活かすための知識を有しているかを検定する
受験資格:制限なし
試験概要:120分、小問226の知識問題(多肢選択式)、オンライン実施(自宅受験)

などなどの試験です。
そのために参考図書が掲載されていて、それを読み進めることで試験勉強とする人が大半ではないのでしょうか。

また、WEB試験で任意の場所で受験、なんでも参照OKなので、参考書みながら、ググりながら受けることができます。
しかし、ググるだけですぐわかるような問題はほとんどないので頭に入れて理解しておく必要があります。

1、入門できたかわからないが、G検定前に入門編で行なった事

入門本と呼ばれるもので、数式がとにかくないor簡単なものを4~5冊読む

理想は書店に行って実際にモチベーションが保ちそうな本を選んだ方がいいです。
AI系の本は数式がびっしり書いてあったり、とにかく分厚かったり、(AI系にかぎらず)無機質な本が多い印象なので、実際に見て感じを掴んだ方がいいです。

自分は書店でゆっくり選ぶ時間がなかったので他人のレビューを読み漁って下記の4冊をとりあえず一気に購入しました。
一部時間の関係上無視していますが(もちろん後でやりますw)、学習した順番通りに書いています。

人工知能は人間を超えるか ディープラーニングの先にあるもの

以前も、ベンチャーエンジニアが最近読んだ本まとめ でレビューを描きましたが

  • ディープラーニング界隈で一番の有名人と言っても過言ではない松尾豊教授が執筆した本
  • AIの現代までの歴史、取り巻く環境など
  • 機械学習・ディープラーニングの仕組みの簡単な概要
  • 松尾豊教授のディープラーニングにかける熱い想いを感じれる

などを広く浅く知ることができます。
1冊目にはこれしかないと思います。

~短期集中講座~ 土日でわかるPythonプログラミング教室 環境づくりからWebアプリが動くまでの2日間コース

  • pythonを簡単に学べる
  • Docker, Git, Djyangoなどを使ってチャットボットwebアプリ作成
  • MeCabとマルコフ連鎖を使える

ような本なので、
正直プログラマの人が読むとしたら物足りない内容なので他の本を読んだ方がいいです。

自分は割り切ってサンプルで書いてあるコードをひたすら解析して、同じようなチャットボットを作成しながらpythonに慣れる用途で使いました。

pythonやったことないのにいきなりAI系のフレームワーク使って機械学習のアルゴリズム実装するって結構ハードル高いと思うので
まずpythonで何か作って、「pythonはできるから次AIやろー」的なノリを作るために使いました。

やさしく学ぶ 機械学習を理解するための数学のきほん ~アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで

  • 機械学習で使う、回帰、ロジスティック回帰などの手法と数式の解説
  • 復讐のために数式を読むための数学?を記載したページがある
  • アヤノとミオの対話形式のため読みやすい
  • 機械学習の数学を初学だとかなりムズイが、これよりもやさしく解説している本はなかなかなさそう

機械学習の初歩の初歩の数学を解説してくれています。
本の半ばくらいからpythonを使ってアルゴリズムを実装する章に入りますが、自分は後述するG検定にまず標準を定めていたので無視しましたww(もちろん後でやります)

初めてのTensorFlow 数式なしのディープラーニング

  • 冒頭の1/4くらいでディープラーニングの基礎を解説
  • 残り3/4くらいでTFLearnを使っていろいろやれる
  • 手書き文字画像のMNISTデータセットを使って、画像の分類問題
  • RNNでの対話テキストの分類

などなどやってる感を出せる本です。
自分はG検定後にやろうかと思ってるので無視していますww(もちろん後でやります)

2、G検定

入門知識の獲得が済んだら、いよいよG検定の勉強です!!
自分は参考図書含め下記の本と模擬試験で学習しました。

人工知能は人間を超えるか ディープラーニングの先にあるもの

上記で解説したので割愛。
たまたまG検定学習前に読んでいましたが、再度一読しました。

ここからは問題全体の2割くらいの出題で、機械学習・ディープラーニングのブームや歴史にフォーカスした問題が多かった印象です。

深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト

  • 一般的なまとめテキスト
  • シラバスの章に沿って解説+章末問題

第3回の直前に出版されたようです。
かなり浅く、全体に渡って解説されているので、G検定の勉強のみならず興味ある人は読むといいかもしれません。

AI白書 2019

  • 「技術動向」「事例」「倫理、法務分野」の3本立て
  • 大きい、分厚い。さすが白書。濃密な内容。しかし索引がない。
  • 各分野の近年の事例はびっしり。面白い

「事例」の分野はなかなか密度が濃く、G検定でなくとも一読しておくと面白いです。
しかし白書と言ってるだけに、読み物としての魅力は薄く。かなり羅列気味の内容になっています。
寝落ちしたり、浸水したり散々でしたがかろうじて読みました(実際はほとんど頭に入ってないですw)

索引もなく、使いにくいので付箋を貼ったり索引を自分で作成しないと実用性は低くなります。

この本の読破に一番時間がかかったのですが、出題は2割程度でG検定の学習コスパは悪いです。
時間がなくとりあえずG検定合格を目標にするのでしたら、これは無視して他を勉強した方がいいと思います。

しかし自動運転の分野は頻出のため後述する問題集などを通して学習した方がいいです。

深層学習 (機械学習プロフェッショナルシリーズ)

  • 数式祭り
  • 基本的なモデルの解説を他の本よりも詳細に学べる
  • 回帰、ロジスティック回帰、ディープニューラルネットワーク、CNN、 RNN、ボルツマンマシンなどなど

実際にAIを学習するとしたら外せない部分になると思います。

ここの分野からの出題が一番多く6割くらいの印象。
あえて「ここの分野」と言ったのは、実際試験で出題される物は、この本では全然足らず自らググったり学習する必要があります。
ここ本でカバーできるのは全体の6割の中のさらに7割くらいの印象。

徹底攻略 ディープラーニングG検定 ジェネラリスト問題集

  • 問題集
  • シラバスの章に沿って問題100問くらい+最終章に模擬試験

実試験よりもかなり簡単なため注意が必要です。
模擬試験で95%取れていましたが、本番では60~70%の感覚でした。
合格ラインは発表されていませんが、60~70%との予想が出回っているのでスレスレかもしれませんねww

Study-AI G検定(ディープラーニングと機械学習の検定)模擬テスト

  • Study-AIが提供している模擬試験
  • 無料β版だがかなり本番さながら

こちらの方が実試験のレベルに近い印象だが、出題形式が若干異なり、複数選択の問題などがある。
自分はこちらでは最終仕上げに活用し72%ほどの正答率。

本番試験

  • 想定よりも難しい
  • 公式問題集やStudy-AIの試験からも結構出る
  • 今年になってからの新技術や法改正問題が難問か出る
  • 2時間はキツイが、意識して早く解かないと時間切れになる

全て解き終わりましたが、前述した通り60~70%の感覚。

合格ラインは公開されていないが、合格率は公開されていて60%程度の簡単な試験との印象を持ちますが、
実際はディープラーニングという技術のため難易度は高いです。
そのため、しっかり学習して知識をつける必要があり、良質な試験だと感んじました。

今後の予定

1、G検定のため、無視した部分を学習(入門書籍のプログラミング)

2、統計学、確率、線形代数などの機械学習数学の学習

3、さらに実践的な機械学習・ディープラーニングの学習

4、Kaggleなど

今回の学習で機械学習数学の知識が圧倒的に足りていないことが判明したので、次はその部分を重点的に学んでから
発展的な内容に進もうかと思います。

さいごに

ここまでの内容を学習する前は

  • 機械学習なんて数式まみれで絶対無理!!
  • 人工知能とか絶対むずいだろ

のような考えで躊躇していましたので、かなり優しいところからスモールステップ方式で学習しました。
その結果、機械学習・ディープラーニングの大枠を捉えることができ、勉強すべき内容とイメージが具体的になってハードルが下がった気がします。

いつの日かシリコンバレー(それか深セン、それとも渋谷?)のAIエンジニアになれる日を夢見てww
今後も長い目で見て学習を続けていければと思います!

Why do not you register as a user and use Qiita more conveniently?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away