More than 5 years have passed since last update.

チームラボグループ

【翻訳】scikit-learn 0.18 User Guide 目次

Last updated at 2017-10-25Posted at 2016-12-18

http://scikit-learn.org/0.18/user_guide.html をgoogle翻訳した
チュートリアルはこちら

ユーザーガイド

1. 教師付き学習

1.1. 一般化された線形モデル未訳

最小二乗法
1. 最小二乗法の複雑さ
リッジ回帰
1. リッジの複雑さ
2. 正規化パラメータの設定：一般化された相互検証
最小絶対収縮および選択演算子 - Lasso
1. 正則化パラメータの設定
  1. 相互検証の使用
  2. 情報基準ベースのモデル選択
マルチタスクのLasso
Elastic Net
マルチタスクElastic Net
最小角度回帰 - LARS
LARS Lasso
1. 数学的処方
直交マッチング追求（OMP）
ベイジアン回帰
1. ベイジアンリッジ回帰
2. 自動妥当性判定 - ARD
ロジスティック回帰
確率的勾配降下 - SGD
パーセプトロン
パッシブアグレッシブアルゴリズム
ロバストネス回帰：異常値とモデル化誤差
1. 異なるシナリオと有用な概念
2. RANSAC：RANdom SAmple Consensus
  1. アルゴリズムの詳細
3. Theil-Sen推定器：一般化 - 中央値ベースの推定器
  1. 理論的考察
4. フーバー回帰
5. ノート
多項式回帰：基底関数を用いた線形モデルの拡張

1.2. 線形および二次判別分析未訳

線形判別分析を用いた次元削減
LDAおよびQDA分類子の数学的定式化
LDA次元削減の数学的定式化
収縮
推定アルゴリズム

1.3. カーネルリッジ回帰未訳

1.4. サポートベクターマシン

分類
1. 多クラス分類
2. スコアと確率
3. 不均衡な問題
回帰
密度推定、新規性検出
複雑
実用上のヒント
カーネル関数
1. カスタムカーネル
  1. Python関数をカーネルとして使用する
  2. グラム行列の使用
  3. RBFカーネルのパラメータ
数学的処方
1. SVC
2. NuSVC
3. SVR
実装の詳細

1.5. 確率的勾配降下未訳

分類
回帰
スパースデータの確率的勾配降下
複雑
実用上のヒント
数学的処方
1. SGD
実装の詳細

1.6. 最近傍法未訳

教師なし最近傍法
1. 最も近い隣人を見つける
2. KDTreeクラスとBallTreeクラス
最近傍分類
最近傍回帰
最近傍法のアルゴリズム
1. ブルートフォース
2. K-Dツリー
3. ボールツリー
4. 最近傍アルゴリズムの選択
5. leaf_sizeの効果
最寄りの重心分類器
1. 最も近いシュリンケンセントロイド
近くのおおよその近所
1. 地域感受性ハッシングフォレスト
2. 局所感性ハッシュの数学的記述

1.7. ガウスプロセス未訳

ガウスプロセス回帰（GPR）
GPRの例
1. ノイズレベル推定を伴うGPR
2. GPRとカーネルリッジ回帰の比較
3. Mauna Loa CO2データのGPR
ガウスプロセス分類（GPC）
GPCの例
1. GPCによる確率的予測
2. XORデータセット上のGPCの図
3. 虹彩データセットにおけるガウスプロセス分類（GPC）
ガウスプロセスのカーネル
1. ガウスプロセスカーネルAPI
2. 基本カーネル
3. カーネル演算子
4. ラジアル基底関数（RBF）カーネル
5. マテランカーネル
6. 有理二次カーネル
7. Exp-Sine-Squaredカーネル
8. ドットプロダクトカーネル
9. 参考文献
レガシーガウスプロセス
1. 導入回帰の例
2. ノイズの多いデータをフィッティングする
3. 数学的処方
  1. 最初の仮定
  2. 最良線形不偏予測（BLUP）は、
  3. 経験的に最良の線形偏り予測器（EBLUP）
4. 相関モデル
5. 回帰モデル
6. 実装の詳細

1.8. クロス分解未訳

1.9. ナイーブベイズ未訳

ガウスナイーブベイズ
多項式ナイーブベイズ
ベルヌーイナイーブベイズ
アウトオブコアのナイーブベイズモデルのフィッティング

1.10. 決定木未訳

分類
回帰
多出力問題
複雑
実用上のヒント
ツリーアルゴリズム：ID3、C4.5、C5.0およびCART
数学的処方
1. 分類基準
2. 回帰基準

1.11. アンサンブルメソッド

バギングメタ推定器
ランダム化された木の森
1. ランダムフォレスト
2. 非常にランダム化された木
3. パラメーター
4. 並列化
5. 機能重要度評価
6. 全くランダムなツリー埋め込み
AdaBoost
1. 使用法
グラディエントツリーブースト
1. 分類
2. 回帰
3. 追加の弱い学習者をフィッティングする
4. ツリーサイズの制御
5. 数学的処方
  1. 損失関数
6. 正規化
  1. 収縮
  2. サブサンプリング
7. 解釈
  1. 機能の重要性
  2. 部分依存
VotingClassifier
1. 大多数のクラスラベル（多数決/厳選）
  1. 使用法
2. 加重平均確率（ソフト投票）
3. GridSearchでVotingClassifierを使用する
  1. 使用法

1.12. 多クラスアルゴリズムと多ラベルアルゴリズム

マルチラベル分類フォーマット
1つの残りの部分
1. マルチクラス学習
2. マルチラベル学習
1対1
1. マルチクラス学習
エラー訂正出力コード
1. マルチクラス学習
マルチ出力回帰
複数出力の分類

1.13. 特徴選択

分散の少ないフィーチャの削除
一変量機能の選択
再帰的な特徴の除去
SelectFromModelを使用した機能の選択
1. L1ベースの機能選択
2. ランダム化スパースモデル
3. ツリーベースの機能選択
パイプラインの一部としての機能の選択

1.14. 半教師あり未訳

ラベル伝播

1.15. 等張性回帰

1.16. 確率較正

1.17. ニューラルネットワークモデル（教師あり）未訳

多層パーセプトロン
分類
回帰
正規化
アルゴリズム
複雑
数学的処方
実用上のヒント
warm_startでより多くの制御

2. 教師なし学習

2.1. ガウス混合モデル未訳

ガウス混合
1. GaussianMixtureの長所と短所
  1. 長所
  2. 短所
    2古典的ガウス混合モデルにおける成分数の選択
2. 推定アルゴリズム期待値最大化
変分ベイズガウス混合
1. 推定アルゴリズム：変分推論
2. BayesianGaussianMixtureとの変容推論の長所と短所
  1. 長所
  2. 短所
3. ディリクレのプロセス

2.2. マニホールド学習未訳

導入
Isomap
1. 複雑
局所的に線形埋め込み
1. 複雑
ローカルで修正された線形埋め込み
1. 複雑
ヘッセ行列の固有マッピング
1. 複雑
スペクトル埋め込み
1. 複雑
ローカル接線スペースアライメント
1. 複雑
多次元スケーリング（MDS）
1. メトリックMDS
2. 非メトリックMDS
t-分散確率的近傍埋め込み（t-SNE）
1. t-SNEの最適化
2. バーンズハットt-SNE
実用上のヒント

2.3. クラスタリング未訳

クラスタリング方法の概要
K平均
1. ミニバッチK-Means
親和性伝播
平均シフト
スペクトルクラスタリング
1. ラベルの割り当て方法の違い
階層的クラスタリング
1. 異なるリンケージタイプ：ワード、完全な平均リンケージ
2. 接続制約の追加
3. メトリックの変更
密度ベースの空間クラスタリング(DBSCAN)
階層を用いたバランスのとれた反復的な削減とクラスタリング (BIRCH)
クラスタリングのパフォーマンス評価
1. 調整済みランドインデックス
  1. 利点
  2. 欠点
  3. 数学的処方
2. 相互情報ベースの得点
  1. 利点
  2. 欠点
  3. 数学的処方
3. 同質性、完全性およびV-尺度
  1. 利点
  2. 欠点
  3. 数学的処方
4. Fowlkes-Mallowsの得点
  1. 利点
  2. 欠点
5. シルエット係数
  1. 利点
  2. 欠点
6. カリンスキー・ハラバズ指数
  1. 利点
  2. 欠点

2.4. Biclustering 未訳

スペクトルコ・クラスタリング
1. 数学的処方
スペクトルバイクラスタリング
1. 数学的処方
バイクラスタリング評価

2.5. コンポーネント内の信号を分解する（行列分解問題）

主成分分析（PCA）
1. 正確なPCAと確率論的解釈
2. インクリメンタルPCA
3. ランダム化SVDを用いたPCA
4. カーネルPCA
5. スパース主成分分析（SparsePCAおよびMiniBatchSparsePCA）
切り捨て特異値分解と潜在意味解析
辞書学習
1. あらかじめ計算された辞書によるスパースコーディング
2. 一般的な辞書学習
3. ミニバッチ辞書学習
因子分析
独立成分分析（ICA）
非負行列分解（NMFまたはNNMF）
潜在的ディリクレ割り当て（LDA）

2.6. 共分散推定未訳

経験的共分散
縮小共分散
1. 基本的な収縮
2. Ledoit-Wolfシュリンク
3. オラクル近似収縮
スパース逆共分散
ロバスト共分散推定
1. 最小共分散行列式

2.7. 新規性と外れ値の検出

新規性の検出
外れ値検出
1. 楕円形の封筒を取り付ける
2. アイソレーションフォレスト
3. 1クラスSVM対楕円エンベロープ対アイソレーションフォレスト

2.8. 密度推定

密度推定：ヒストグラム
カーネル密度推定

2.9. ニューラルネットワークモデル（教師なし）未訳

制限付きボルツマン機械
1. グラフィカルモデルとパラメータ化
2. ベルヌーイ制限付きボルツマンマシン
3. 確率的最尤学習

3. モデルの選択と評価

3.1. クロスバリデーション：推定器の成果を評価する

クロスバリデーションされたメトリックの計算
1. クロスバリデーションによる予測の取得
クロス検証イテレータ
i.i.dのクロスバリデーションイテレータデータ
1. K倍
2. Leave One Out（LOO）
3. Leave P Out（LPO）
4. ランダム置換相互検証a.k.a.シャッフル＆スプリット
クラスラベルに基づいた階層化を持つ相互検証イテレータ
1. 層状K倍
2. 層別シャッフルスプリット
グループ化されたデータの相互検証イテレータ
1. グループk倍
2. 1つのグループを離れる
3. Pグループを残す
4. グループシャッフルスプリット
あらかじめ定義されたFold-Splits / Validation-Sets
時系列データの相互検証
1. 時系列分割
シャッフルの注意
相互検証とモデル選択

3.2. 推定器のハイパーパラメータのチューニング

完全なグリッド検索
ランダム化されたパラメータの最適化
パラメータ検索のヒント
1. 客観的なメトリックの指定
2. コンポジット推定値とパラメータ空間
3. モデル選択：開発と評価
4. 平行
5. 障害に対するロバスト性
ブルートフォースパラメータ検索の代替
1. モデル固有の相互検証
2. 情報基準
3. その他の推定器

3.3. モデル評価：予測の質を定量化する

得点パラメータ：モデル評価ルールの定義
1. 一般的なケース：定義済みの値
2. メトリック関数からスコアリング戦略を定義する
3. 独自の採点オブジェクトの実装
分類メトリック
1. バイナリからマルチクラス、マルチラベルまで
2. 精度スコア
3. コーエンのカッパ
4. 混乱マトリックス
5. 分類レポート
6. ハミング損失
7. ジャカード類似性係数スコア
8. 精密、リコール、F-対策
  1. バイナリ分類
  2. マルチクラスとマルチラベルの分類
9. ヒンジ損失
10. ログの損失
11. マシューズ相関係数
12. レシーバ動作特性（ROC）
13. ゼロ1つの損失
14. ブリーザスコア損失
マルチラベルランキングメトリック
1. カバレッジエラー
2. ラベルランクの平均精度
3. ランキングの損失
回帰メトリック
1. 説明された分散スコア
2. 平均絶対誤差
3. 平均二乗誤差
4. 中央絶対誤差
5. R²スコア、決定係数
クラスタリングメトリック
ダミー推定器

3.4. モデルの永続化

永続化の例
セキュリティと保守性の制限

3.5. 検証曲線：スコアをプロットしてモデルを評価する

検証曲線
学習曲線

4. データセット変換

4.1. パイプラインとFeatureUnion：推定器の組み合わせ

パイプライン：連鎖推定器
1. 使用法
2. ノート
FeatureUnion：複合フィーチャスペース
1. 使用法

4.2. 特徴抽出

dictsからのフィーチャーのロード
フィーチャーハッシュ
1. 実装の詳細
テキスト特徴抽出
1. 言葉の表記
2. 希少性
3. 共通ベクタライザの使用法
4. Tf-idf項の重み付け
5. テキストファイルのデコード
6. アプリケーションとサンプル
7. Bag of Wordsの表現の限界
8. ハッシュトリックを使用して大きなテキストコーパスをベクトル化する
9. HashingVectorizerでアウトオブコアスケーリングを実行する
10. ベクタライザクラスのカスタマイズ
画像特徴抽出
1. パッチ抽出
2. 画像の接続性グラフ

4.3. データ前処理

標準化、平均除去と分散のスケーリング
1. 範囲へのフィーチャのスケーリング
2. スパースデータのスケーリング
3. 異常値を含むデータのスケーリング
4. センタリングカーネル行列
正規化
二値化
1. 特徴二値化
カテゴリの機能をエンコードする
欠損値の補完
多項式フィーチャの生成
カスタムトランス

4.4. 教師なし次元削減

PCA：主成分分析
ランダム投影
フィーチャアグロメレーション

4.5. ランダムプロジェクション

Johnson-Lindenstraussの補題
ガウスランダム投影
まばらなランダム投影

4.6. カーネル近似未訳

カーネル近似のためのNystroem法
ラジアル基底関数カーネル
Additive Chi Squared Kernel
スキュード・カイ2乗カーネル
数学の詳細

4.7. ペアワイズメトリック、類似性およびカーネル

コサイン類似度
線形カーネル
多項式カーネル
シグモイドカーネル
RBFカーネル
ラプラシアンカーネル
カイ二乗カーネル

4.8. 予測対象（y）を変形する

ラベルの二値化
ラベルエンコーディング

5.データセット読み込みユーティリティ未訳

一般データセットAPI
玩具のデータセット
サンプル画像
サンプルジェネレータ
分類とクラスタリングのためのジェネレータ
1. 単一ラベル
2. マルチラベル
3. Biclustering
回帰のジェネレータ
多様な学習のためのジェネレータ
分解用ジェネレータ
svmlight / libsvm形式のデータセット
外部データセットからのロード
Olivettiはデータセットに直面する
20のニュースグループテキストデータセット
使用法
テキストをベクトルに変換する
より現実的なトレーニングのためのテキストのフィルタリング
mldata.orgリポジトリからデータセットをダウンロードする
野生の顔認識データセットにおけるラベル付きの顔
使用法
例
森林伐採
RCV1データセット
ボストンの住宅価格データセット
ノート
乳癌ウィスコンシン（診断）データベース
ノート
参考文献
糖尿病のデータセット
ノート
手書き数字データの光学的認識
ノート
参考文献
アイリス植物データベース
ノート
参考文献
Linnerrudデータセット
ノート
参考文献

6.計算的に拡大する戦略：より大きいデータ未訳

アウトオブコア学習を使用したインスタンスのスケーリング
ストリーミングインスタンス
フィーチャの抽出
インクリメンタルな学習
例
ノート

7.計算性能未訳

予測レイテンシ
バルク対アトミックモード
機能の数の影響
入力データ表現の影響
モデルの複雑さの影響
フィーチャ抽出レイテンシ
予測スループット
ヒントとテクニック
線形代数ライブラリ
モデル圧縮
モデルの形状変更
リンク

チュートリアルはこちら

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

【翻訳】scikit-learn 0.18 User Guide 目次

ユーザーガイド

1. 教師付き学習

1.1. 一般化された線形モデル 未訳

1.2. 線形および二次判別分析 未訳

1.3. カーネルリッジ回帰 未訳

1.4. サポートベクターマシン

1.5. 確率的勾配降下 未訳

1.6. 最近傍法 未訳

1.7. ガウスプロセス 未訳

1.8. クロス分解 未訳

1.9. ナイーブベイズ 未訳

1.10. 決定木 未訳

1.11. アンサンブルメソッド

1.12. 多クラスアルゴリズムと多ラベルアルゴリズム

1.13. 特徴選択

1.14. 半教師あり 未訳

1.15. 等張性回帰

1.16. 確率較正

1.17. ニューラルネットワークモデル（教師あり） 未訳

2. 教師なし学習

2.1. ガウス混合モデル 未訳

2.2. マニホールド学習 未訳

2.3. クラスタリング 未訳

2.4. Biclustering 未訳

2.5. コンポーネント内の信号を分解する（行列分解問題）

2.6. 共分散推定 未訳

2.7. 新規性と外れ値の検出

2.8. 密度推定

2.9. ニューラルネットワークモデル（教師なし） 未訳

3. モデルの選択と評価

3.1. クロスバリデーション：推定器の​​成果を評価する

3.2. 推定器のハイパーパラメータのチューニング

3.3. モデル評価：予測の質を定量化する

3.4. モデルの永続化

3.5. 検証曲線：スコアをプロットしてモデルを評価する

4. データセット変換

4.1. パイプラインとFeatureUnion：推定器の​​組み合わせ

4.2. 特徴抽出

4.3. データ前処理

4.4. 教師なし次元削減

4.5. ランダムプロジェクション

4.6. カーネル近似 未訳

4.7. ペアワイズメトリック、類似性およびカーネル

4.8. 予測対象（y）を変形する

5.データセット読み込みユーティリティ 未訳

6.計算的に拡大する戦略：より大きいデータ 未訳

7.計算性能 未訳

1.1. 一般化された線形モデル未訳

1.2. 線形および二次判別分析未訳

1.3. カーネルリッジ回帰未訳

1.5. 確率的勾配降下未訳

1.6. 最近傍法未訳

1.7. ガウスプロセス未訳

1.8. クロス分解未訳

1.9. ナイーブベイズ未訳

1.10. 決定木未訳

1.14. 半教師あり未訳

1.17. ニューラルネットワークモデル（教師あり）未訳

2.1. ガウス混合モデル未訳

2.2. マニホールド学習未訳

2.3. クラスタリング未訳

2.6. 共分散推定未訳

2.9. ニューラルネットワークモデル（教師なし）未訳

3.1. クロスバリデーション：推定器の成果を評価する

4.1. パイプラインとFeatureUnion：推定器の組み合わせ

4.6. カーネル近似未訳

5.データセット読み込みユーティリティ未訳

6.計算的に拡大する戦略：より大きいデータ未訳

7.計算性能未訳