37 search resultsShowing 1~20 results

Stocked
tanakmura

@tanakmura

独断と偏見によるx86命令拡張の印象

仕事すすまなすぎて辛いので何か出力したくなった。 16bit -> 32bit (386) 結構色々変わっていて、レジスタの自由度が上がって少しRISCっぽくなっている。 32bit -&...

8
2
Comment0
tanakmura

@tanakmura

vpmadd52luq

浮動小数の乗算は、整数の乗算よりbit数が少なく済みます。 IEEE754浮動小数だと、 (2^expA * mantA) * (2^expB * mantB) は、 (2^(expA+expB...

1
1
Comment0
tanakmura

@tanakmura

EVEX

(ModRM, REX, VEXについて知ってる前提で書いているので、知らない人は昔書いた http://d.hatena.ne.jp/w_o/20130126/1359183872 を読んでく...

5
1
Comment1
tanakmura

@tanakmura

vfixupimmps

浮動小数値の種類に対応する変換ができます。 区別できる種類は、 qNaN sNaN zero +1.0 -inf +inf 負数 正数 の7個です。これがsrc2で指定されます。 どういう変換を...

1
1
Comment0
tanakmura

@tanakmura

vpscatterdd

scatter も実装されました。 レジスタに入っている16個のインデクスと、配列先頭アドレスを加算して、出てきた16個のアドレスに、入力値をストアします。 # include <immi...

1
0
Comment0
tanakmura

@tanakmura

vpcompressd

expandの逆をします。 これだけマスクの扱いが特殊ですね。マスクと対応する入力を拾ってきて、出力には下から詰めます。 # include <immintrin.h> # incl...

0
0
Comment0
tanakmura

@tanakmura

vpexpandd

SIMDの天敵として、綺麗に並んでいないデータがあります。 この問題はソフトウェアの設計、仕様とも関わる難しい問題で、一発で問題解決する銀の弾丸は無いのですが、少しでも状況を良くするために、便利...

0
0
Comment0
tanakmura

@tanakmura

sdeでavx512を使う

このカレンダーについて 労力の最小化を目標としています。 sdeでavx512を使う さてまずは動作確認できる環境が欲しいのでsdeとgccを使って…て書こうとしたが、 http://syoyo...

9
4
Comment0
tanakmura

@tanakmura

vrangeps

値が範囲に入っているかどうかを比較する時、絶対値で比較したい場合はたまにありますね。 rangeps は、符号を多少操作して min, max します。 即値4bitのうち2bitで、 min ...

0
0
Comment0

37 search resultsShowing 1~20 results

Qiita is a knowledge sharing service for engineers.

  1. You can follow users and tags
  2. You can stock useful information
  3. You can make edit suggestions for articles
Functions that can be used after logging in