漢なら OpenCL ですね!
しかしときには比較用に CUDA も使いたくなったり, CUDA コードを OpenCL に移植してみたいときがありますね!
でもちょっと試してみたいときとか CUDA SDK のインストールするの面倒ですね!
(とはいえ, nvcc を呼び出したり NVRTC を使いたいときは結局は CUDA Toolkit が必要でした. 特に Windows 環境)
OpenCL の場合は clew https://github.com/OpenCLWrangler/clew がありますが, CUDA にも CUEW で CUDA SDK いらずで CUDA program をコンパイルできるライブラリがあります.
本家はいくらか古いのと, cuDNN も PR 上がってますがマージされていないので,
CUDA 12.1, cuDNN 8.0 に対応したのをアップロードしました.
master
をお使いください.
CUDA runtime API
途中までですが, CUDA runtime API も対応中です...
まとめ
CCLCudaAPI と合わせて OpenCL, CUDA どちらも同じような関数で使えるようにしてみたいですね!