LoginSignup
0
0

More than 5 years have passed since last update.

_mm_mul_pd() > x86 Intrinsics List || _ps: パックド単精度浮動小数点, _pd: パックド倍精度浮動小数点, _ss: スカラー単精度浮動小数点, _sd: スカラー倍精度浮動小数点

Last updated at Posted at 2018-07-21
動作環境
GeForce GTX 1070 (8GB)
ASRock Z170M Pro4S [Intel Z170chipset]
Ubuntu 16.04.4 LTS desktop amd64
TensorFlow v1.7.0
cuDNN v5.1 for Linux
CUDA v8.0
Python 3.5.2
IPython 6.0.0 -- An enhanced Interactive Python.
gcc (Ubuntu 5.4.0-6ubuntu1~16.04.4) 5.4.0 20160609
GNU bash, version 4.3.48(1)-release (x86_64-pc-linux-gnu)
scipy v0.19.1
geopandas v0.3.0
MATLAB R2017b (Home Edition)
ADDA v.1.3b6
gnustep-gui-runtime v0.24.0-3.1
PyMieScatt v1.7.0

現在ソースリーディングを進めているコード(ADDA)において下記のような実装がある。

interaction.c
...
ipx = _mm_cvtsi32_sd(ipx,ix);
ipx = _mm_mul_pd(p360,ipx);
...

Matrixに関する何かというのは推測できる。
_sdや_pdは何か?

上記の関数を含めた一覧は以下に記載されている。

SSE関連の実装なので、自分には直接関係はなさそう。

ps, pd, ss, sd

https://www.xlsoft.com/jp/products/intel/compilers/ccl/12/ug/intref_cls/common/intref_bk_avx_fma.htm
によると

  • _ps: パックド単精度浮動小数点
  • _pd: パックド倍精度浮動小数点
  • _ss: スカラー単精度浮動小数点
  • _sd: スカラー倍精度浮動小数点

これ以上の情報は不要なので、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0