はじめに
PythonをDocker上で動かせるリポジトリを作成しました。
構築済みのもの
numpyやscikit-learn等のオーソドックスなものはもちろん、言語処理100本ノック 2020 (Rev 2)でも活用したので、MeCab-Cabochaも構築済みです(これローカルでやろうとしたら結構面倒くさい)。
使い方
各勉強項目ごとにscripts配下でディレクトを切ってもらえたら使いやすいのかのと思います。
キカガクさんの勉強したときは /scripts/kikagaku
言語処理100本ノック 2020 (Rev 2)の勉強したときは /scripts/languageProcessing100Knocks
みたいな感じ。
使用例
.
├── README.md
├── docker
│ ├── CRF++-0.58.tar.gz
│ ├── Dockerfile
│ ├── cabocha-0.69.tar.bz2
│ └── requirements.txt
├── docker-compose.yml
└── scripts
├── kikagaku
│ ├── histogram.png
│ ├── howToUse_Numpy.py
│ ├── howToUse_Pandas.py
│ ├── matrix.py
│ ├── modelRead.py
│ ├── models
│ │ └── multipleRegressionAnalysisModel.pkl
│ ├── multipleRegressionAnalysis.py
│ ├── pairplot.png
│ ├── samples
│ │ ├── housing.csv
│ │ └── simpleRegressionAnalysisSample.csv
│ ├── scatter_plot.png
│ ├── scatter_plot_centered.png
│ └── utils
│ ├── __pycache__
│ │ ├── util.cpython-313.pyc
│ │ └── util.cpython-39.pyc
│ └── util.py
└── languageProcessing100Knocks
└── 1
├── 0.py
├── 1.py
├── 2.py
├── 3.py
├── 4.py
├── 5.py
├── 6.py
├── 7.py
├── 8.py
└── 9.py
自分の勉強用としてgit管理
-
github gitlab 等でリポジトリ作成
-
リポジトリの初期化
rm -rf .git
-
新しいリポジトリを初期化
git init
-
すべてのファイルをステージング
git add .
-
コミットを作成
git commit -m "Initial commit"
-
リモートリポジトリの設定
git remote add origin <リモートリポジトリのURL>
-
最初のプッシュ
git push -u origin main
おしまい!
備考
pipでinstallできるものは requirements.txt で追記するだけで済みます。
Mecab-Cabochaの環境構築は本来 CRF++とCabochaをダウンロードしたものを解凍してモジュールインストール。
とか他にもやることが多いので最新版をダウンロード済みです(/docker配下の cabocha-0.69.tar.bz2 と CRF++-0.58.tar.gz)。それを解凍からモジュールインストールまで行ってるので環境構築で挫折、ということはなるべく省けるようになっていると思います。