この記事は実際に自分が遭遇したエラーを解決してくれた stack overflow の記事を日本語訳したものです。
version libcublasLt.so.11 not defined in file libcublasLt.so.11 with link time reference?
とかいうエラー出たんやが、どうやって直すんやこれ
python -c "import torch"
で pytorch をインポートしようとしたらこんなエラー出てきたンゴ……。
error.sh
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/afs/cs.stanford.edu/u/brando9/ultimate-utils/ultimate-utils-proj-src/uutils/__init__.py", line 13, in <module>
import torch
File "/dfs/scratch0/brando9/miniconda/envs/metalearning_gpu/lib/python3.9/site-packages/torch/__init__.py", line 191, in <module>
_load_global_deps()
File "/dfs/scratch0/brando9/miniconda/envs/metalearning_gpu/lib/python3.9/site-packages/torch/__init__.py", line 153, in _load_global_deps
ctypes.CDLL(lib_path, mode=ctypes.RTLD_GLOBAL)
File "/dfs/scratch0/brando9/miniconda/envs/metalearning_gpu/lib/python3.9/ctypes/__init__.py", line 382, in __init__
self._handle = _dlopen(self._name, mode)
OSError: /dfs/scratch0/brando9/miniconda/envs/metalearning_gpu/lib/python3.9/site-packages/torch/lib/../../nvidia/cublas/lib/libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11 not defined in file libcublasLt.so.11 with link time reference
どうやって直すんやこれ?
ベストアンサー
eval が言ってる通り、pytorch1.13 が勝手に nvidia_cublas_cu11
, nvidia_cuda_nvrtc_cu11
, nvidia_cuda_runtime_cu11
, nvidia_cudnn_cu11
をインストールしおったからこうなったんやで
ワイも自分で入れた CUDA toolkit あるのに同じ目に合った
ワイの場合は pip uninstall nvidia_cublas_cu11
して解決や
割とみんな CUDA toolkit 自分で入れてるはずやから PyTorch くんコレ直してくれんかなぁ