「環境構築無しでプログラミングを始められる!」
この言葉に甘えてはや2年ほどが経っただろうか。そのおかげで僕のPCの環境はぐちゃぐちゃだった。
condaとpipを適当に使い、よくわからないから仮想環境も構築せずに、importしてなかったら適当にpip installして耐え忍んでいた。
いつかはやらないとなー。とか思ってたけど、ついに重い腰を上げて手術することにした。
理由は三つ。
・ Webアプリ開発にも興味が出てきて、環境のことを知らないといけなくなった
・ VSCodeで謎にシャットダウンされ、Pythonファイルが開けなくなりコードが飛んだ
・ Jupyter Notebookで、突如挙動不審になり、言語が本当は一つしか表示されないはずがPythonが二つ出た
まあ正直2つ目と3つ目はVSCodeのバグかもしれないが、環境のせいかもしれないし、いつかは知らないといけない
からと思い、手術に踏み切った。
当然、冒頭の甘い言葉にやられて環境のことは全く知らない。ゼロから調べまくって勉強した。その軌跡をここに記しておく。
スタートとゴール
僕の環境はMacOS。環境はごちゃごちゃでスパゲッティ。シェルはzsh。
ゴールは、仮想環境をvenvもしくはDockerで管理すること。baseを汚くしない
→venvで管理することにした。まだDockerを使うほど本格的な開発はしない予定なので。
baseでpip listってやったらこれの8倍はあった。適当にやりすぎた。
スタートする前に優秀な助手の追加
もちろん、ChatGPT。コマンドとか環境のこととか分かってなかったけど、記事を読みながらChatGPTに聞きまくったらなんとなくは分かった。まじで優秀。大好き。
Anacondaをやめる
Anacondaのメリットをあまり感じられてなかったし、condaとpipを混ぜるとやばい、みたいな感じだったから、思い切ってAnacondaを使わないことにした。
Pythonのパッケージリポジトリは2種類
NumpyやPandasなどの便利なライブラリ、その他パッケージを使うには事前にpip installやconda installでインストールしておく必要がある。どこからインストールしてくるかというと、PyPIやAnaconda Cloudといったパッケージリポジトリからしてくる。
PyPI
PyPIはPythonソフトウェア財団が運営を行っており、非常に多くのパッケージ、ライブラリが公開されている。2022年12月時点で43万を超えるらしい。
pip installでインストールするものはここからされる。
ただ、誰でもPyPIにライブラリを追加できてしまうため、安全性の面では不安が残る。らしい。
つまり、種類は莫大だけど安全とは言い切れないのがPyPI。
あ、ちなみに読み方は「パイピーアイ」らしい。ちょっと残念。。
Anaconda
AnacondaはPythonの実行環境で、データサイエンスに必要なツールやライブラリをまとめて提供しているプラットフォーム。そのため、Anacondaをインストールすれば基本的なデータサイエンスは行うことができる。
conda installでインストールする。
ライブラリたちはAnaconda Cloudで管理されており、検査されているがその分種類がPyPIに比べて圧倒的に少ないのが特徴らしい。
つまり、種類は限られているが安全なのがAnacondaといった感じ。らしい。
pipとcondaを併用してはいけない
pipとcondaは犬猿の仲らしい。両者を適当に併用すると最悪環境がぶっ壊れたり、いろいろ不具合が起きるらしい。
お互いは独立したパッケージ管理ツールだから、condaでもpipでも同じパッケージをインストールしてしまい、それが色々あーなってこーなって悪さをするらしい。
pipとcondaで同じパッケージをインストールしたときに特に不具合に繋がるっぽい。
へー、って思ったけど正直理解できなかった。とりあえずよくないらしい。
まあチームに同じものを管理する人が二人いるけどその二人は一切連絡を取らない、みたいな感じだと管理体制に不具合が生じるよなあって思った。まあそんな感じだろ。
よくわからんし、Anaconda使うのやーめた
結論、よくわからん。構造が難しい問題は、そもそもその構造が生じないように原因を消し去るというのが僕がよくやる手抜き問題解決方法。
condaの方が種類少なくて安全、かつcondaとpipの併用が良くないなら、
「condaでなかったらpipでインストール」という流れていいじゃん、と思っていろいろ調べたらそうじゃないらしい。
もうよくわからん、condaを使うのをやめれば全て解決や、という結論になった。
こいつ分かってないな、って思われてそうなので、「だってこの人たちがそういってたんだもん」という言い訳を置いておく。
YouTubeで動画を見て概観を掴む
何か新しいことを始める時、YouTubeで動画を倍速で見て概観を掴むのは常套手段。
参考にした動画はこれ。
動画では、おすすめの環境構築方法として以下の三つが挙げられていた。難易度が高い順かつおすすめ順に上から並べた。
Dockerを使う方法
おすすめだけど難易度が高い方法。
Dockerを使って環境構築をするらしい。簡単に作れて簡単に壊せるのがメリットらしいけど、僕はまだDockerを簡単に作れるレベルに達していないので見送り。
てかそこまで大規模に管理する必要がない
Dockerを使わない方法
Dockerを使った方がいいけど、難易度は高くない方法。
今回採用した方法。あとで詳しく。
簡単にまとめると、Pythonのバージョン管理はpyenv、仮想環境の管理はvenvでやる。
コラボラトリー
めちゃくちゃ簡単だけど、おすすめではない方法。
コラボラトリーは環境構築不要で、Googleアカウントさえ持っていればipynbを動かせるもの。
GPUが必要なときはこれでやるけど、使い勝手が悪いから僕個人的には好きじゃない。
大手術開始
参考にしたサイトはこれ。
概観を掴む用
まず読んだもの
まあ大体ここら辺を読めば道筋はなんとなく見える。そしてこれを軸に進めることにした。
なので、Pythonのバージョン管理はpyenv, 仮想環境はvenvで管理する方針に定めた。
Anacondaの削除
これを参考にしてやったら、すぐにできた。バイバイ、Anaconda。
Anacondaをアンインストールすると、Anaconda-Navigatorのアプリに「?」が表示される。初めてみた笑
まあ実は昔もAnacondaがなぜか動かなくなったことがあって(多分pipとの併用が原因)Anacondaを再インストールしたりした。つまり過去何回も別れている恋人とまた別れたわけだ。(?)ということは。。?
pyenvの削除
基本的にこの記事を参考にして真似したので、なんでかはわからないけどいろいろいじってとりあえず削除。
とりあえず削除。実はここら辺でpipやpythonが使えなくなっていてやや焦ってた
(あれ・・?心停止しちゃった?)
zsh: command not found: python
pip not found
pyenvのインストール
とりあえずインストール。
しかし、ここでエラーが出た。
Cannot install in Homebrew on ARM processor in Intel default prefix (/usr/local)!
ああ、忘れていた、Appleシリコンによる弊害を。
ただ、流石にもう情報がネットに溢れているのでググって解決しようと思っていろいろ調べているうちに脱線してなぜかPythonのアンインストールに行き着いた。
pythonのアンインストール
pythonがパソコンの中にいくつもあったのでアンインストール。ほんと不思議。いつの間にか増えてるんだから。もしかして自己増殖する?
これを元にやった。結局全て消そうとしたら一個だけ「permission denied」みたいに怒られちゃったのでそれだけ残して他を削除。
Homebrewのアンインストール
brew listコマンドを打ったら大量に出てきて汚かったので、半分勢いでアンインストール。
友達と喋りながらやっていたので勢いでやっちゃってますが、皆さんはもっと慎重にやってください。取り返しのつかないことになるかもしれないので。知らんけど。
再構築開始
摘出は終わったので、新しいツールたちにパーツ替え。
pyenvのインストール
pythonのバージョンを管理するためのツール。pyenvがあるおかげで複数のpythonバージョンを分けて使うことができる。pyenvは使わなくてもいいらしいけど、参考にした記事が使ってたから使った。
参考にした記事はどっかにいってしまったので、まあ多分ここら辺の記事を読めばできる。
なんかこんな記事もあったが、見て見ぬふりをした。知らない。
新しいpythonのインストール
この三つのコマンドでいけた。はず。
pyenv install -l
pyenv install {インストールしたいpythonのバージョン}
pyenv global {インストールしたpythonのバージョン}
python -Vで確認。
無事、3.11.3が出てきたので完了。pipも復活。
まあ何か詰まったらこれとか見れば多分おけ
さあ、仮想環境の構築をやろう
途中Anacondaを消したせいで使えなくなったPythonとpipも、新しいpythonをインストールしたら治ったので手術は完了。18時間かかった。笑(まるまる作業してたわけではないけど)
さて、ここからは再発防止に向けた仮想環境づくり。もちろん、仮想環境とは何かから理解する必要があったのでまた記事を読みまくった。
ここら辺をさーっと読めば大体わかった。あとは仲間に聞いた。笑 持つべきものは仲間や。
一つ勘違いしていたのは、仮想環境ではbase環境にあるものも使える、baseにないものを仮想環境で補うといったイメージだったが、違った。仮想環境は仮想環境で独立しているので、毎回Numpyやpandasをインストールする必要がある。
それは面倒なので、requirements.txtによく使うものは書いておいて、それを最初にpip install -r requirements.txtで読み込んで一気にインストールするのが主流らしい。
あと環境管理ツールはこの記事とかを読んで決めた。
結局初心者だし、公式が出しているものは安心感があるのでvenvにした。
Gitの再構築
なんかこれを機にGitもHomebrewで管理しよっかってことになって元々のGitではなくHomebrewのGitに変えることにした。意味があるのかはわからない。アップデートとかしやすいらしい。
結局HomebrewからGitインストールして、.zshrc書き換えてPATHをHomebrewのGitになるようにした。
そのあとProgateのGit環境構築をやり直して、完了。
ここら辺は難なくできた。
まとめ
これからの管理方法
python: pyenvで管理
仮想環境: venvで管理
とりあえずはこれでやってみる。それで不便だったらまた調べて変える。
感想
いやー、疲れたけど無事に終わってよかった。今回いろいろ環境のことを触ってすごく勉強になったからいい機会ではあったと思う。プログラミング初心者の「環境構築不要!」に甘えてきたしっぺ返しをくらったけど。
あと、シェルとかバージョン管理ツールとかいろいろ触って、まだまだ知らなきゃいけないことがたくさんあると実感できたので、これからはそこら辺の勉強もしっかりしていきたい。
これとか見て。
あと、手術中の心の動きはここにまとめたので、見てみてね
エラー出てたけど原因を知らなくて全然解決できなかったもの
.zshrcとかの中、PATH = 〜とかはダメらしい。(スペース入れちゃいけない)
スペース入れてsource ~/.zshrcってやったら
/Users/ユーザー名/.zshrc:2: bad assignment
って怒られて環境壊しちゃったかと思って焦ってた。
でもスペース消したら行けて、そーゆーことか!ってなって安心した。
正しくはPATH=で書かないといけない。
疑問に思ったことはChatGPTで解決
他の人とプロダクト開発する時、python以外のプログラムもあるけどそれvenvで管理できるの?
→例えば、バックエンドをPython、フロントエンドをJavaScriptでやっている場合は、それぞれ仮想環境管理ツールを使えば良いっぽい。Pythonはvenv, JavaScriptはnpmかyarnみたいな。
らしいです。
参考になるかも
クリーンな開発環境構築入門(Python版)
今回は使わなかったが、Kindle Unlimitedで無料なので、この本を参考にしても良かったかも。
最後に
普段はツイッターでデータサイエンスに関連する無料の優良教材などや自分の勉強経歴など、見ている人のモチベを上げるような情報発信をたくさんしている。
ぜひ見てね。
Twitter→@A7_data
無料の優良教材をたっくさんまとめた記事はこちら