0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

CUDA C > 入門してみた > deviceQueryの実行まで

Last updated at Posted at 2016-09-09
動作環境
Windows 8.1 pro (64bit)
MEMORY: 16GB
GeForce GTX 750 Ti

ChainerでのCNNに興味が出てきた。
自分が持っているFPGA開発用PCには偶然GeForce GTX 750 Tiが入っていたのでCUDA Cを入門してみた。

本屋で衝動買いしたCUDA Cの本 5000円(とRの本)をちょっとずつ読んでみる。
(追記: 5000円のCUDAの本はKindle版で2700円で売っていた。。。おうふ)。

セットアップに関しては以下の記事を参考にさせていただきました。
情報感謝です。
http://qiita.com/wazakkyd/items/ab79920b22b24b385487

上記記事の通り以下のインストールを順番にすると、はまることはありませんでした。

  • Visual Studio Community 2013
  • CUDA 7.5

deviceQueryのビルドと実行

deviceQueryをビルド、実行してみた。

Visual Studio用のslnファイルは上記記事の通り以下にある。
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\1_Utilities\deviceQuery

ビルドしたexeファイルは以下に生成される(これが少しわかりにくかった)。
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\bin\win64\Debug

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\bin\win64\Debug>deviceQuery.exe
deviceQuery.exe Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 750 Ti"
  CUDA Driver Version / Runtime Version          7.5 / 7.5
  CUDA Capability Major/Minor version number:    5.0
  Total amount of global memory:                 2048 MBytes (2147483648 bytes)
  ( 5) Multiprocessors, (128) CUDA Cores/MP:     640 CUDA Cores
  GPU Max Clock rate:                            1202 MHz (1.20 GHz)
  Memory Clock rate:                             2700 Mhz
  Memory Bus Width:                              128-bit
  L2 Cache Size:                                 2097152 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536),
3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  CUDA Device Driver Mode (TCC or WDDM):         WDDM (Windows Display Driver Mo
del)
  Device supports Unified Addressing (UVA):      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simu
ltaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 7.5, CUDA Runtime Versi
on = 7.5, NumDevs = 1, Device0 = GeForce GTX 750 Ti
Result = PASS

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\bin\win64\Debug>
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\bin\win64\Debug>

コマンドプロンプトのオープン

エクスプローラでexeファイルが見つかっている場合、以下の方法で対応するコマンドプロンプトを開いて実行している。
http://qiita.com/7of9/items/6bac8e1b98b7524218b8

0
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?