はじめに
この業界のスピードは人類史上最速なのではないかと思うレベルなのですが、タイトルの通りPython×データサイエンス&AIの分野で戦うならば当然触ったことあるよねって言うレベルのライブラリをまとめてみました。
(モジュールとライブラリの違いとか知りません。過不足あります。絶対。)
目次
1.データ加工系
2.データ読み込み系
3.データ可視化系
4.機械学習系
5.自然言語処理系
6.WebApp開発フレームワーク
1.データ加工系
Numpy
http://www.numpy.org/
http://cs231n.github.io/python-numpy-tutorial/
Pandas
https://pandas.pydata.org/
http://pandas.pydata.org/pandas-docs/version/0.15/10min.html
Scipy
https://www.scipy.org/
http://programming-study.com/technology/python-scipy/
2.データ読み込み系
csv
db
3.データ可視化系
matplotlib
https://matplotlib.org/
https://matplotlib.org/users/index.html
plotly
4.機械学習系
scikit-learn
tensorflow
chainer
theano
5.自然言語処理系
mecab
gensim
juman
6.WebApp開発フレームワーク
django
おわりに
とりあえず「Colaboratory」で全部触ってみましょう。
https://colab.research.google.com
jupyterをGoogle先生が進化させてます。
http://jupyter.org/
雑感
これらに加えて、データサイエンス&AIの領域では、Rの知識とクラウド(AWSとGCP)の知識、さらに論文ベースのアルゴリズムの知識と、最先端研究の知識。一生、データサイエンス&AIに飽きることなく生きていけそうです。とりあえず、詳しくないのはサンプルコードを叩くか...。