はじめに
こんにちは、株式会社ジールの@Suguru-Terouchiです。
身の回りがバタバタしてて投稿が遅くなってしまいました。
いまさらAI学んでみた(第1回)、いまさらAI学んでみた(第2回)、いまさらAI学んでみた(第3回)と続いて第4回目になります。
これまでで機械学習の手法である「教師あり学習」と「教師なし学習」について学んできました。
今回は手法としては最後になる「強化学習」について書いていきたいと思います。
強化学習ってなに?
強化学習について学ぶ前に「教師あり学習」と「教師なし学習」についてざっくりおさらいしましょう。
「教師あり学習」 ・・・ データと答えを同時に与えて学習する手法
「教師なし学習」 ・・・ 答えのないデータから特徴や法則を見つけ出す学習手法
覚えてましたか?その手法の名前と一緒に考えると簡単ですよね。
では、これ以外の学習手法ってなにか想像できますか?
・・・
・・・
はい、出来ませんよね、、えっ、出来た?・・・そんな貴方は天才です。
想像出来なかった、そこの貴方も大丈夫です、一緒に学んでいきましょう。
それでは本題の強化学習について知っていくために活用事例から入った方が理解しやすいと思います。
有名なところで言うと「AlphaGo(アルファ碁)」という囲碁AIや自動お掃除ロボットのRo〇mbaさん、これから実用化が期待されている自動車の自動運転システム等があります。
囲碁AI(こんなドンピシャなイラストがあるなんていらすとや様、ハンパないっす。)
残念ながら私は囲碁をやったことがないので、我が家で絶賛活躍中のRo〇mbaさんを例に見ていきたいと思います。
(すみません、本当は別のメーカーです。。)
自動お掃除ロボットというくらいなので、部屋の掃除をするのがお仕事だと思いますが、それだけで良いのでしょうか?
もしかしたら毎日のお掃除が半日くらいかかってしまうかもしれません。それだと困りますよね。
それぞれのご家庭によって、部屋の広さや間取り、家具の配置など様々だと思いますが、
それらをカメラやセンサーなどを駆使して、掃除し忘れなく、効率的な掃除をするために強化学習が利用されています。
この例では掃除をするという機能を持ったロボットが自ら試行錯誤を行っていくなかで、
どのようなルートで掃除をしたら効率良く掃除が出来た(最高得点)か?を学習していく、これが強化学習ということですね。
自分で学習して成長していくようで、なんだか オラ、ワクワクすっぞ! 将来性感じますよね。
AWS DeepRacer
これで強化学習の概念は分かってきたかなと言うところでもう少し踏み込んでいきたいと思います。
強化学習を学んでいく中で個人的に興味を持っているもので、AWS DeepRacerというサービスがあります。
簡単に紹介するとラジコンカーを用いたレース競技ですが、操作するコントローラーはなく、強化学習を利用した自律型駆動マシンとなっています。(科学の力ってすげー)
少し話が逸れてしまいましたが、このDeepRacerのワークショップがこれから強化学習を学習する人の学習教材として、
とても良いと感じたのでご紹介したいと思います。
おわりに
いかがでしたでしょうか。個人的には強化学習が一番興味あります。
第4回で機械学習の基礎の部分は終了になります。
次回はまだ検討中ですが、少し実践を交えた内容にしていきたいと思います。
データ活用をサクッと始めるなら!
株式会社ジールでは、「ITリテラシーがない」「初期費用がかけられない」「親切・丁寧な支援がほしい」「ノーコード・ローコードがよい」「運用・保守の手間をかけられない」などのお客様の声を受けて、オールインワン型データ活用プラットフォーム「ZEUSCloud」を月額利用料にてご提供しております。
ご興味がある方は是非下記のリンクをご覧ください: