前回こんな記事(TensorFlowをインストールしてみる)書いて機械学習するやでって言ったけど、そもそも機械学習ってなんや?ってなったので自分なりにまとめたものをメモがてら書きます。間違ってても怒らないで…
機械学習ってなんだよ・・・
機械学習(きかいがくしゅう、英: machine learning)とは、人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである
──wikipedia(機械学習)
AIの研究課題の1つってことでいいのかな…?
じゃあ技術・手法って何があるんじゃろか・・・?
技術・手法って何があるのー?
決定木学習
相関ルール学習
ニューラルネットワーク
遺伝的プログラミング
帰納論理プログラミング
サポートベクターマシン
クラスタリング
ベイジアンネットワーク
強化学習
表現学習
多すぎィ!!!
ニューラルネットワークとか強化学習は聞いたことあるけど他の聞いたことないなぁ…
とりあえずニューラルネットワークと強化学習をまとめてみますかー。
ニューラルネットワークってなんぞや?
ニューラルネットワーク (NN)
人工ニューラルネットワーク (ANN) とも呼ばれ、生物の神経ネットワークの構造と機能を模倣するという観点から生まれた学習アルゴリズムである。人工神経を相互接続したもので計算を構造化し、コネクショニズム的計算技法で情報を処理する。現代的ニューラルネットワークは非線形な統計的データモデリングツールである。入力と出力の間の複雑な関係をモデル化するのに使われ、データのパターン認識や観測された変数間の未知の同時分布における統計的構造を捉えるなどの用途がある。
──wikipedia(機械学習)
はい。またwikiです。
何が書いてあるかわっかんねぇなこれ…
ざっくりいうと人間の脳の仕組みを模倣しようぜ!ってこと。
人間の脳にはニューロンって言う神経細胞が信号のやりとりしてて、その仕組みをコンピュータでも再現できるんじゃね!?ってことらしいっす。
詳しい話は…んにゃぴよくわかんないです(逃げ)
Q:ニューラルネットワーク使ったら何が出来るの?
A:学習重ねて画像解析とか音声解析が出来るようになるで!
強化学習ってなんだよ
教師あり学習と似てるけど「答え」は提示されない。
じゃあ何が提示されるんだよ… 行動の選択肢と報酬です。
答え=報酬になるじゃないか・・・!ってなりますが、強化学習の報酬は各行動に対してではなく、連続した行動の結果に対して与えられます。
例えるなら、あるクエストをクリアする。これが強化学習における報酬になります。クエストをクリアする過程で敵を探す、攻撃をするなんて言った各行動を報酬を与えない。逆に逐一与えるのが教師あり学習ゾ。
Q:じゃあどうやって各行動を評価すんだよ(困惑)
A:最後の行動から遡って各行動を評価していくゾ
強化学習では連続した行動の結果に対する報酬から、各行動の評価を自分自身で評価する。これにより各行動に対する報酬を逐一設定しなくても、自分の評価を基に報酬が得られ、連続した行動を学習してくれる訳です
強化学習のモデル化とかあるけどその辺よくわかんないんで後日。
まとめ
んにゃぴよくわかんないです