Python
AI
データサイエンス

Python×データサイエンス&AIのライブラリをまとめてみた

はじめに

この業界のスピードは人類史上最速なのではないかと思うレベルなのですが、タイトルの通りPython×データサイエンス&AIの分野で戦うならば当然触ったことあるよねって言うレベルのライブラリをまとめてみました。
(モジュールとライブラリの違いとか知りません。過不足あります。絶対。)

目次

1.データ加工系
2.データ読み込み系
3.データ可視化系
4.機械学習系
5.自然言語処理系
6.WebApp開発フレームワーク

1.データ加工系

Numpy

http://www.numpy.org/
http://cs231n.github.io/python-numpy-tutorial/

Pandas

https://pandas.pydata.org/
http://pandas.pydata.org/pandas-docs/version/0.15/10min.html

Scipy

https://www.scipy.org/
http://programming-study.com/technology/python-scipy/

2.データ読み込み系

csv

https://qiita.com/okadate/items/c36f4eb9506b358fb608

db

https://pypi.python.org/pypi/db.py

3.データ可視化系

matplotlib

https://matplotlib.org/
https://matplotlib.org/users/index.html

plotly

https://plot.ly/python/

4.機械学習系

scikit-learn

http://scikit-learn.org/stable/

tensorflow

https://www.tensorflow.org/

chainer

https://chainer.org/

theano

http://deeplearning.net/software/theano/

5.自然言語処理系

mecab

http://taku910.github.io/mecab/

gensim

https://radimrehurek.com/gensim/

juman

http://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN

6.WebApp開発フレームワーク

django

https://docs.djangoproject.com/ja/2.0/

おわりに

とりあえず「Colaboratory」で全部触ってみましょう。
https://colab.research.google.com

jupyterをGoogle先生が進化させてます。
http://jupyter.org/

雑感

これらに加えて、データサイエンス&AIの領域では、Rの知識とクラウド(AWSとGCP)の知識、さらに論文ベースのアルゴリズムの知識と、最先端研究の知識。一生、データサイエンス&AIに飽きることなく生きていけそうです。とりあえず、詳しくないのはサンプルコードを叩くか...。