t-sne って何?
t-SNE という多次元かつ大規模データを2次元まで圧縮して、クラスタごとに可視化する手法がある。これをCUDA で実装したのが、@stfate さんの記事で紹介されている
現行の問題
とはいえ、本家リポジトリは2年以上メンテされてないので、CUDA13 とかでは動かない。なので、とりあえず最低限、ビルド&最低限の動作確認の改修までは行った。ついでに、github の dczifraさんによるバッチ設定もマージしてみた。
こちら。「branch=cuda13」なのでそこだけ注意。
蛇足
- DockerやREADME等ドキュメントは改訂してない。
- t-SNE のCUDAによる実装には、NVIDIA RapidsAI の cuMLが定期的にメンテされてる(かつパフォーマンスも上回ってそう)なので、実用的にはあまり意味がないかもしれないが、自分で動作を確認できる、という意義はあるとは思う。
参考
@stfate さん記事
CannyLab 本家tsne-cuda GitHubリポジトリ
dczifraさんによる、バッチサイズ追加
NVIDIA's cuML