機械学習ってなあに
こんにちは!某都内の大学文系科目を専攻している大学生です。 AIって言葉は聞いたことがあったけど、実際にどんなことができるのって思う方いませんか? 実はAIって言葉を漠然と考えてる人が多いと思うんですよね! 今回はAIの領域の一つである、機械学習についてまとめてみたいと思います! 間違ってる部分、理解が追いついていない部分もあると思うので、その際はご指導をいただけたらと思います! それでは Let's Start!想定している読者
・AIについて興味あるけど始め方がわからない方 ・機械学習という言葉は知ってるけど実際何ができるのと疑問を持っている方機械学習とは
定義から入ります。 機械学習とは、"データの意味を理解するアルゴリズムの応用と科学"です。 つまり、僕たちが生きていく中で接する様々なデータ(バンコクのコンドミニアムの広さと家賃やミドリムシの細胞の長さまで様々なもの)の"意味"を理解し、それを使って様々な"応用"(コンドミニアムの広さを使って家賃を予測したり、ミドリムシの細胞の長さを使って、オスなのかメスなのかを判別したり)をすることなんですね。 *例は適当に考えました。機械学習の種類
機械学習は大きく分けて教師あり学習・教師なし学習・強化学習の3つに分かれています。教師あり学習とは
教師あり学習とは、予測したいものの答え(正解)がわかっている状態のトレーニングデータ(訓練データ)からモデルを学習し、未知のデータやこれから現れるデータを予測できるようにする方法のことです!そして正解のデータの質によって2つに分けることができます。
・正解ラベル(答え)が雨か晴れか、0か1か、オスかメスか、など離散値の性質を持つ教師あり学習のことを"分類"(Classification)と呼びます。
・正解ラベルがバンコクの家賃や気温など連続値の性質をもつ教師あり学習のことを”回帰”(Regression)と呼びます。
過去の正解が事前に用意できるデータに関してはこの方法はとても強力に作用すること間違いなし(そんなことない時もあるよ)
強化学習とは
強化学習とは環境(environment)とのやり取りに基づいて性能を改善するエージェントを開発する方法のことです。 環境の現在の状態に関する情報には報酬(reward)というものも含まれています。つまり、エージェントが行なった行動に対して環境が報酬を与えることによって、もっと報酬をもらいたいエージェントが性能を強化していく仕組みということです!
頑張っちゃうエージェント可愛いですね。
教師なし学習
教師あり学習では、モデルをトレーニングする際に正解データが事前に用意されていましたよね。 強化学習では、エージェントの行動に対して報酬の度合いが用意されていましたよね。しかし、実際の社会はそこまで甘くないです。答えなんてわからないものをなんとかして、答えを作り出したい時もありますよね。
教師なし学習では、ラベルづけされていないデータや構造が不明のデータを扱います。
教師なし学習を用いることで、答えがわからなかったり、報酬がなかったりしても、データの構造を調べることで意味のあるデータを取り出すことができます。
たとえば、クラスタリング(Clustering)という教師なし学習では、距離が近いデータをまとめ上げることによって、
近いもの同士でいくつかのグループを作ることができます。
3つの学習を知ってみて
AIという漠然なものから機械学習という少し現実味のあるものを知ることができ、これまでの認識が変わった方も多いかなと期待しております。 機械学習は、使いこなせばとても強力なツールでもあり、その反面、利用者の知識が及ばないと性能の悪い子ができちゃうというというのが僕の所感でした。また記事を書いていこうと思います。
あと、もっと写真を使いたい!
以上ここまで読んでくださり、ありがとうございました。