はじめに
この本を使って勉強しています
Pythonによる AI・機械学習・深層学習アプリのつくり方
1-1 機械学習で何ができる?
分類(classification) ... 与えられたデータを分類
データの特徴を調べて分類する回帰(regression) ... 過去の実績から未来の値を予測
過去のデータを学習して将来の数値予測を行うクラスタリング(clustering) ... データを似たものの集合に分類
分類と違うのはあらかじめ決まっている項目に分けるのではなく似たもの区分けする推薦(recommendation) ... データの関連情報を導き出す
ネットショッピングでユーザの嗜好にあったものを推薦するデータの次元数を削減(dimensionality reduction) ... データの特徴を残して削減
大きな次元から特徴的なデータを特定して次元を削減し、効率的にデータを分析する
何に適用できる?
- 画像解析 画像の物体を判定
- 音声解析 音声からテキストに変換、どんな音なのか判定
- テキスト解析 文章のカテゴリ分け、特定表現の抽出・構文解析
機械学習の種類
- 教師あり学習(Supervised Learning)
- データとともに正解が与えられる
- 未知のデータに対して予測を行う
- 教師なし学習(Unsupervised Learning)
- 正解は与えられていない
- 未知のデータから規則性を見出す
- 強化学習(Reinforcement Learning)
- 行動により部分的に正解が与えられる
- データから適切な買いを見つける
1-2 どのようなシナリオで機械学習を行うのか
1. ゴールの決定
2. データの収集
3. データの整形・加工
4. データを学習
1. 機械学習の手法を選択
2. パラメータの調整
3. データを学習してモデルを構築
5. モデルを評価
6. 十分な精度がでなければ4.に戻る
7. 業務で活用
1-3 機械学習で利用するデータの作り方
機械学習で役に立つ汎用的なデータフォーマット
- カンマ区切りデータ CSV 形式
- ini ファイル形式
- XML
- JSON(JavaScriptのオブジェクト形式を元に考案された構造化データ)
- YAML
その他、Numpy保存形式、Pythonオブジェクトをそのまま書き込むことができる pickleなど