More than 5 years have passed since last update.

行列積のTraceを高速に計算する

Last updated at 2018-12-12Posted at 2018-12-12

問題点

機械学習アルゴリズムを実装する際に、2つの行列$A, B \in \mathbb{R}^{n \times m}$の積のTrace$\mathrm{Tr}(A \cdot B^T)$を計算するシーンがよくあるが、定義通りnumpyのtraceを使うと非常に遅くて困る。

SparseMatrixを使わないなら

np.einsum('ij,ij->', A, B)

がぶっちぎりで速く、SparseMatrixにも対応したいなら

np.sum(A * B)

がわりかし速い！

主に4パターンの計算方法がある(他にもあったらコメントください)。

np.trace(A @ B.T)

np.sum(A * B)

from numpy.core.umath_tests import inner1d

np.sum(inner1d(A, B))

ただし、このinner1dはnumpyの内部で使われている関数なので推奨されていないようです(参照3)。

np.einsum('ij,ij->', A, B)

アインシュタインの縮約記法を知らない方は参考の1.を参照してください。とても詳しくまとめてあります。ただし、この書き方はnumpy arrayのみでscipyのSparseMatrixには実装されていないです。ただ、実装する動きはあるようです(参照4)。

ちゃんと同じ結果になるかを確認。

速度を%timeitで計測し比較。

Dが圧勝！定義通り計算するより10倍くらい速い！！ただ、上述したとおりeinsumはSparseMatrixでは使えないので、疎行列を扱う際にはBを使うのが良いという結論になりました。Bも定義通り計算するよりも6倍くらい速く、申し分ない結果になりました。

行列の転置マーク$T$を右肩に書く派と左肩に書く派で流派が分かれていて論文読んでて混乱する。するよね？