データ分析を始めるとき、環境構築でつまずく人は多いです。
特に NumPy / Pandas / SciPy / PyTorch など C依存が多いライブラリ を扱う場合、
pip や uv だけではビルドエラーになりがちです。
そのため、データ分析では Conda が最も安定 というのが定番の結論です。
ここでは「最初にこれをやれば OK」という ベストプラクティスを手順でまとめ ました。
🎯 この記事のゴール
- Miniconda を使って最小&軽量セットアップ
- Python 3.11 の安定環境を作る
- NumPy / Pandas / JupyterLab を無難に入れる
- よくあるトラブルを避けるコツを知る
1. Miniconda をインストール
Anaconda より Miniconda(最低限のみ) を推奨します。
公式ダウンロード:
https://www.anaconda.com/docs/getting-started/miniconda/install
PATH登録(zsh用)
- ~/.zshrc に miniconda3/bin を追記(重複回避)
- 公式の conda init zsh を実行して初期化ブロックを作成
- シェル再読み込みで即時反映
touch "$HOME/.zshrc" \
&& grep -qxF 'export PATH="$HOME/miniconda3/bin:$PATH"' "$HOME/.zshrc" || echo 'export PATH="$HOME/miniconda3/bin:$PATH"' >> "$HOME/.zshrc" \
&& "$HOME/miniconda3/bin/conda" init zsh \
&& exec zsh
2. 基本は conda-forge チャンネルを使う
データ系は conda-forge のほうが新しくて安定。
最初に設定しておくと便利:
conda config --add channels conda-forge
conda config --set channel_priority strict
3. データ分析用の環境を作成
Python 3.11 は 2025年時点で 最も安定しているデータ分析用バージョン。
注:.venvはIDE cursorで自動検出されるので、便利
conda create -y -p ./.venv python=3.11
4. 環境をアクティベート
conda activate ./.venv
5. 基本パッケージ(NumPy/Pandas/Jupyter)を conda-forge から入れる
データ分析系は conda-forge の依存解決が最も安定。
conda install -c conda-forge numpy pandas jupyterlab matplotlib
必要なら SciPy や scikit-learn も:
conda install -c conda-forge scipy scikit-learn
6. pip と混ぜるのは最後の手段
- conda → pip の順で入れるとまだ安全
- pip が多すぎると依存関係が壊れやすい
例(どうしても pip のときは最後):
pip install package_name
7. 環境を export(共有・再現用)
conda env export > environment.yml
復元は:
conda env create -f environment.yml
8. base 環境には何も入れない
これだけは鉄則。
依存関係が汚れたり、トラブル時に修復しにくいため。
base はただの「管理者」みたいなものにしておく。
不要なパッケージ削除:
conda clean -a
📌 まとめ
データ分析では以下が最も安定:
- Miniconda
- Python 3.11
- conda-forge からインストール
- C系は conda 優先
- pip は足りない分だけ後から追加
この構成にしておけば、
NumPy / Pandas / Jupyter / SciPy / scikit-learn などは
ほぼトラブルなく扱えます。