scipy
numpy
pandas
python3
statsmodels

Pythonによるデータ処理のテキスト

Pythonでデータ処理をするために必要となる方法についてのテキストを作成しています.
 
---------------------
テキストの試作品(PDF形式78ページ:2.01MB) 2018/05/12更新
 使用しているモジュール:
 JupyterLab, pandas, NumPy, SciPy, StatModels, matplotlib
 →テキストの紹介ページで,サンプルデータなども配布しています.
---------------------
Python自体のテキストはこちらで公開しています.
 
(2018/05/12)
学校でプログラミング教えています.
学生にデータ処理を教えるためのテキストを作っています.
 
Pythonをベースにしていますが,色んなシステムやパッケージを混在して使うことになりますので,初心者が見ると「何がどれだけあって,何をしているのか分からない」という状態になると思います.
それでとりあえず,
・作業環境はPython + JupyterLab
・表の扱いはpandas
・データの保存形式はCSVファイルとSQLデータベース
・統計処理はNumPy + SciPy
と,使用するツールを限定して使い方を解説しています.
 
このテキストはまだ試作品の段階ですので,ご使用になる場合はあくまで「参考資料」というご理解でお願いします.
 
最終的には,Pythonによる統計処理の入門テキストにしたいと考えていまして,ご指摘やご提案,ご助言いただけましたらありがたいです.紹介ページのコメント(非公開形式)投稿でメッセージお待ちしています.
ご協力いただいた方はテキストの謝辞の項に,謝意と共にお名前を掲載させていただきます.(ご希望なさらない場合はその旨お知らせくださいませ)
 
テキストの著作権は保持していますが,フリーソフトとして公開します.


補足事項,ご案内など

【補足】(2018/05/13)
 統計学の用語や基礎知識についても解説していますが,このあたりはまだ「要注意項目」です.標準的な教科書に沿って,要約した解説をしていますが,かなり手を加えないといけないと考えています.「統計検定」の教科書も参考にしはじめています.
 機械学習用パッケージの使用方法についても掲載を検討中です.