前回の内容
Pythonではじめる機械学習 part1
*間違いや指摘があれば、ぜひコメント下さい!
1章(後半) 概要
主に機械学習に用いられるライブラリ群の紹介
scikit-learn
さまざまな機械学習用のライブラリが入ったパッケージ
参考書では、基本的にscikit-learnに梱包されたアルゴリズムを題材に学習を進めていく仕組みとなっている。
何か一つを指すと言うよりも、機械学習ライブラリの集合という認識
Numpy
科学技術計算用のライブラリ
多次元配列や、線形代数、フーリエ変換など高度な数学式をプログラムから実行したいときに利用される。
scikit-learnのI/FはNumpy配列が前提になっている。
matplotlib
科学技術計算向けのグラフ描画ライブラリ
テストデータや解析結果を確認する際に、これを利用するとグラフィカルに表現してくれる。
初めて実行すると結構感動する。
pandas
解析を行う際に、対象データをDataFrameというオブジェクトに落とし込んで表現することを可能にするライブラリ
生成したデータは、SQLライクにアクセスできるほか、各種フォーマット(.csv, .xslx)からDataFrameを作成するためのI/Fも提供している。
基本的にライブラリ群の紹介なので、今回所感は割愛します!
次回から、機械学習らしい内容に入っていきます。