dhq_boiler
@dhq_boiler

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

nvcc fatal : Could not open input file C:\WINDOWS\TEMP/tmpxft_********_********-*

解決したいこと

CUDA Toolkit 12.1 の nvcc.exe でコンパイルを試したところ、
原因の特定が難しいエラーが出ました。
これをなんとかして解消したいです。
3日間悩みましたが一向に答えが出ないので質問させていただきます。

発生している問題・エラー

  • Windows 11 Pro
  • Visual Studio 2022
  • CUDA Toolkit 12.1
  • GeForce Game Ready ドライバー 531.18
  • NVIDIA GeForce GTX 1080
nvcc.exe hello.cu
nvcc fatal   : Could not open input file C:\WINDOWS\TEMP/tmpxft_00006cb8_00000000-2

該当するソースコード

hello.cu
#include <stdio.h>

__global__
void saxpy(int n, float a, float *x, float *y)
{
  int i = blockIdx.x*blockDim.x + threadIdx.x;
  if (i < n) y[i] = a*x[i] + y[i];
}

int main(void)
{
  int N = 1<<20;
  float *x, *y, *d_x, *d_y;
  x = (float*)malloc(N*sizeof(float));
  y = (float*)malloc(N*sizeof(float));

  cudaMalloc(&d_x, N*sizeof(float)); 
  cudaMalloc(&d_y, N*sizeof(float));

  for (int i = 0; i < N; i++) {
    x[i] = 1.0f;
    y[i] = 2.0f;
  }

  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
  cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);

  // Perform SAXPY on 1M elements
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);

  cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);

  float maxError = 0.0f;
  for (int i = 0; i < N; i++)
    maxError = max(maxError, abs(y[i]-4.0f));
  printf("Max error: %f\n", maxError);

  cudaFree(d_x);
  cudaFree(d_y);
  free(x);
  free(y);
}

自分で試したこと

  • 環境変数PATHに追加
    • C:\Program_Files\Microsoft_Visual_Studio\2022\Community\VC\Tools\MSVC\14.35.32215\bin\Hostx64\x64
    • C:\Program_Files\Microsoft_Visual_Studio\2022\Community\VC\Auxiliary\Build
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\bin
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\libnvvp
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\lib\x64
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\include
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\extras\CUPTI\lib64
  • 環境変数CUDA_PATHを設定
    • C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1\
  • 環境変数CUDA_HOMEを設定
    • %CUDA_PATH%
  • 環境変数TEMPを設定
    • %SystemRoot%\TEMP
  • 環境変数TMPを設定
    • %SystemRoot%\TEMP
  • Windowsユーザー名に日本語を含まないように調整
  • 環境変数PATHにダブルクオーテーションを含んでいないことを確認
  • C:\Windows\Tempに対して自ユーザーが書き込み権限を持っていることを確認
  • CUDA Toolkitのバージョンを下げてみる
    • CUDA Toolkit v11.8
    • CUDA Toolkit v10.2

Visual Studio 2022は以下にインストールしました。(デフォルトではない、パスに含まれるスペースをアンダースコアに変えました)
C:\Program_Files\Microsoft_Visual_Studio\2022\Community

またCUDA Toolkit v12.1は以下にインストールしました。(デフォルトではない、パスに含まれるスペースをアンダースコアに変えました)
C:\Program_Files\NVIDIA_GPU_Computing_Toolkit\CUDA\v12.1

アンダースコアに変えたのは、インストールパスにスペースを含んでいると何かしら問題が発生するという記事を見たからです。またWindowsユーザー名に日本語を含んでいると問題が発生するとも記事を見ました。

何かお気づきの方は回答いただけると助かります。追加の情報の要求があればなるべく応えます。よろしくお願いします。

0

No Answers yet.

Your answer might help someone💌