動作環境
GeForce GTX 1070 (8GB)
ASRock Z170M Pro4S [Intel Z170chipset]
Ubuntu 16.04.4 LTS desktop amd64
TensorFlow v1.7.0
cuDNN v5.1 for Linux
CUDA v8.0
Python 3.5.2
IPython 6.0.0 -- An enhanced Interactive Python.
gcc (Ubuntu 5.4.0-6ubuntu1~16.04.4) 5.4.0 20160609
GNU bash, version 4.3.48(1)-release (x86_64-pc-linux-gnu)
scipy v0.19.1
geopandas v0.3.0
MATLAB R2017b (Home Edition)
ADDA v.1.3b6
gnustep-gui-runtime v0.24.0-3.1
PyMieScatt v1.7.0
現在ソースリーディングを進めているコード(ADDA)において下記のような実装がある。
interaction.c
...
ipx = _mm_cvtsi32_sd(ipx,ix);
ipx = _mm_mul_pd(p360,ipx);
...
Matrixに関する何かというのは推測できる。
_sdや_pdは何か?
上記の関数を含めた一覧は以下に記載されている。
SSE関連の実装なので、自分には直接関係はなさそう。
ps, pd, ss, sd
https://www.xlsoft.com/jp/products/intel/compilers/ccl/12/ug/intref_cls/common/intref_bk_avx_fma.htm
によると
- _ps: パックド単精度浮動小数点
- _pd: パックド倍精度浮動小数点
- _ss: スカラー単精度浮動小数点
- _sd: スカラー倍精度浮動小数点
これ以上の情報は不要なので、ここまで。