私のpythonデータ分析環境は以下の通りです。
os
fedora22。
DVDに焼く方法だと途中でインストールが止まってしまいできなかったので、fedora21からバージョンアップした。
fedora22最高です。python
anaconda 64bit python3.4です。
python2系は日本語の扱いがめんどうですが、python3系はシンプルに日本語を扱えます。
また、データ分析をするためにはnumpyを筆頭にモジュールが必要で、個別にインストールしようとすると依存関係に悩まされますが、anacondaではまとめてインストール、簡単にアンストールができます。anaconda環境にpipもできます。mecabも動かすことができました。
anacondaもまた最高です。
Download Anaconda機械学習
scikit-learnです。機械学習をする方法は沢山ありますが、あれこれやってもものにならないので、質の良さそうなscikit-learnに絞りました。エディタと実行環境
エディタはgeditです。windowsならサクラエディタです。エディタでコードを書いてqtconsoleに貼り付け実行します。
qtconsoleもまた最高です。ipythonなのでtab補完もできます。この補完やヘルプ機能が本当に便利。膨大なpythonの機能を必要に応じて調べることができます。
IPython notebookも使いましたが、情報伝達にはいいと思うのですが、使いづらかったです。特にグラフをインライン表示させる使い方が使いづらく感じました。コードが見づらくなるのです。qtconsoleの方が使いやすいです。
IDEにspyderがあります。よくできているのですが、使いづらかったです。ソフトウエア開発をするときは使いやすく感じるのかもしれませんが、私には必要ありませんでした。