LoginSignup
3
0

More than 5 years have passed since last update.

courseraのmachine-learning(week1)のメモ

Last updated at Posted at 2016-09-30

たまにメモしないと何も覚えずに終わりそうなので

Week1

courseraのwikiから引用したり、動画見ながらメモ取ったり

機械学習 "Machine Learning"

Arthur Samuel described it as: "the field of study that gives computers the ability to learn without being explicitly programmed." This is an older, informal definition.

古い定義だと、"コンピュータに明示的にプログラムすることなしに機能を学ばせる学問領域"である。

Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."

うまく訳せる気がしない
テキトー訳
タスク(分類)Tと性能(測定値)Pに関連した学習データEを得た時にそれによって学習するコンピュータプログラムのこと

DataScienceの分類
DataSienceの分類 from "http://machinelearningmastery.com/what-is-machine-learning/"

教師あり学習 "Supervised Learning"

正解がある学習データを基に学習する。授業で扱ったのは回帰問題(regression)と分類問題(classification)。分類については、特徴量の数だけ分類する数を増やすことができるが、サポートベクターマシン(SVM)の登場によって無限に分類するプログラムを作ることができるとかなんとか。
以下、引用

In supervised learning, we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input and the output.
Supervised learning problems are categorized into "regression" and "classification" problems. In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some continuous function. In a classification problem, we are instead trying to predict results in a discrete output. In other words, we are trying to map input variables into discrete categories.

訳:
教師あり学習では、データ集合が与えられ正しい出力がどのように成るべきか既に知っている。我々は、この時の入力と出力の間にある関係を得る手法を考える。
教師あり学習問題は回帰問題と分類問題にわけられる。回帰問題では、連続的出力として結果を予測しようとする。これは入力変数をなんらかの連続的関数にマッピングしようとすることを意味する。分類問題では離散的出力として結果を予測しようとする。他の言い方をすると、入力変数を離散的な種類にマッピングしようとすることである。

教師なし学習 "Unspervised Learing"

正解のない学習データから学習する。クラスタリングともいう?
データの中からクラスタを見つける、構造を見つけ出すデータ分析。
以下、引用

Unsupervised learning, on the other hand, allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don't necessarily know the effect of the variables.
We can derive this structure by clustering the data based on relationships among the variables in the data.
With unsupervised learning there is no feedback based on the prediction results, i.e., there is no teacher to correct you.

訳:
一方、教師なし学習では結果がどうなるべきか少ししかわからないかもしくは全くわからない上で問題に取り組む。
変数の影響を知る必要のないデータから構造を見つけ出すことができる(よくわかんない)。この構造を、データの変数間の関係に基づいてクラスタリングすることで導く。教師なし学習では予測した結果に基づいたフィードバックは存在しない。

3
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
0