はじめに
Linux では DMA Bufferを mmap した時に、ある条件が揃うと CPU Cache が無効になり、パフォーマンスが極端に落ちる場合があります。そこで、何故そのようなことが起こるのか説明します。少し長くなるので、次のように記事を幾つかに分けて投稿します。
- はじめに
- Cache Coherence 問題
- Cache Aliasing 問題
3.1 Cache Aliasing 問題とは何か
3.2 Cache Aliasing 問題の解決方法(この記事) - Linux Kernel の Cache 問題の扱い
- Linux では Cache Coherence Hardware を持っていないとDMA Buffer をmmap する際に CPU Cache が無効になる
- Raspberry Pi の例
- RISC-V CPU の注意点
- 所感
1〜3は、コンピューターアーキテクチャの基本的な事項を、簡単に説明したものです。すでにご存じの方は読み飛ばしてください。
4 はこれらの問題を Linux Kernel 内でどのように扱っているかを説明します。
5 がこれらの記事群の結論です。結論だけ知りたい方はここだけ読んでください。
前回の記事 『Linux で DMA Bufferを mmap した時に CPU Cacheが無効になる場合がある (Cache Aliasing 問題とは何か)』 では、「Linux で DMA Bufferを mmap した時に CPU Cacheが無効になる場合がある」原因の一つである Cache Aliasing 問題について説明しました。この記事では、その Cache Aliasing 問題の解決方法を説明します。すでにご存じの方は読み飛ばしてください。
Cache Aliasing 問題の解決方法
ここでは、Cache Aliasing問題(正確には Cache Aliasing 時の Cache Line の一貫性の問題)を解決する方法として次の3つを説明します。
ハードウェアでなんとかする方法
実は、Cache Aliasing 問題をハードウェアでなんとかするのは、ある意味難しいのです。
前章の『Cache Aliasing 問題とは何か』で説明しましたが、Cache Aliasing 問題が発生するのは CACHE の構成が VIPT 方式の場合です。何故 VIPT 方式が採用されたかというと、それは PIPT 方式よりも速くキャッシュのHit/Miss 判定を行えるからです。しかし、Cache Aliasing 問題を解決するために、衝突検知回路などをゴテゴテとつけて PIPT 方式よりも遅くなっては意味がありません。それならば PIPT 方式でいいんじゃね?となります。
結果的にCache Aliasing 問題をハードウェアで解決しようと思えば、そもそも VIPT 方式ではなく PIPT 方式を採用して Cache Aliasing 問題そのものを起こらないようにするほうが簡単です。
ソフトウェアでなんとかする方法
Cache Aliasing 問題をソフトウェアで解決する方法は、次のものがあります。
- 仮想アドレスの割り当てを工夫する
- ページサイズを大きくする
- ページカラーリング
- データの配置やアクセスパターンを工夫する
仮想アドレスの割り当てを工夫する
Cache Aliasing が起こるのは、同じ物理アドレスに対して複数の仮想アドレスを割り当てたときに、VIPT 方式で Cache Line の位置を示す VI(Virtually Index) 部に異なる値が割り当てられる場合です。つまり何らかの方法で同じ物理アドレスの場合は仮想アドレスの VI部に同じ値が割り当てられるようします。
ただし、仮想アドレスの割り当てを工夫するする方法は、仮想記憶を管理している MMU の設定が必要なため、Linux のようなOSを場合は Kernel の助けが必要になります。
ページサイズを大きくする
単純にページサイズ(ページの割り当時の単位)を VI(Virtually Index) の最上位位置よりも大きくします。こうすれば、物理ページを複数の仮想アドレスに割り当ててもページのオフセット値は同じになるので、どちらの仮想アドレスからアクセスしても VI は同じになります。
ページカラーリング
ページカラーリングはキャッシュカラーリングとも呼ばれる手法で、物理アドレスに仮想アドレスを割り当てる際に、仮想アドレスの値を工夫する方法です。
ページカラーリングは、もともと Cache Thrassing への対策として考えられました。Cache Thrashing とは、メモリのアクセスパターンによっては、ある CACHE LINE にアクセスが集中してしまい、頻繁に CACHE LINE のデータの置き換えが起きて却って性能が落ちる現象を指します。
ページに仮想アドレスを割り当てる際に、割り当てる仮想アドレスの値を工夫することで、Cache Thrassing や Cache Aliasing を防ぎます。
しかし、このページカラーリングは、ページの割り当て時のソフトウェア的な負荷が大きく、実装がかなり困難です。
データの配置やアクセスパターンを工夫する
前節の仮想アドレスの割り当てを工夫する方法は、仮想記憶を管理している MMU の設定が必要なため、Linux のようなOSを場合は Kernel の助けが必要になります。そこで、Kernel の助けを借りずに Cache Aliasing 問題を解決するために、アプリケーションのレベルでデータの配置やアクセスパターンを工夫して Cache Aliasing が起きないようにする方法が考えられます。しかし、この方法はソフトウェアのプログラミングがかなり面倒臭いことになります。
キャッシュを使わない
VIPT 方式を採用していて Cache Aliasing 問題が起こりうるシステムで、ソフトウェアで解決するのも難しいとなれば、最終手段としてキャッシュを使わないという手法があります。
一言でキャッシュを使わないといっても、すべての仮想領域からのアクセスでキャッシュ無効にする方法もあれば、次の図のように、一つだけ指定された仮想領域からのみキャッシュを有効にして、それ以外の仮想領域からのアクセスに対してはキャッシュを無効にする方法があります。
ただし、この場合でも『Cache Coherence 問題とは何か』で説明した、MEMORY と CPUの CACHE との間の Coherence問題は残っていることに注意してください。
Fig.1 Disable Cache from the second and higher Virtual Areas
まとめ
この記事では、「Linux で DMA Bufferを mmap した時に CPU Cacheが無効になる場合がある」のを説明する際に、知っておいてほしい Cache Aliasing 問題について、次のような解決方法を紹介しました。
- CACHE に VIPT 方式を使わない
- ページサイズを大きくする
- ページカラーリング
- データの配置やアクセスパターンを工夫する
- キャッシュを使わない
次の記事 『Linux で DMA Bufferを mmap した時に CPU Cacheが無効になる場合がある (Linux Kernel の Cache 問題の扱い)』では、Linux Kernel が Cache Coherence 問題と Cache Aliasing 問題をどのように扱っているかについて説明します。
蛇足
CACHE に VIPT 方式が使われないもう一つの理由
最近の CPU では VIPT 方式の CACHE はあまり使われていません。その理由の一つは、この記事の「ハードウェアでなんとかする方法」で述べた通り、Cache Aliasing 問題をハードウェアで解決するには そもそも CACHE を VIPT 方式でなく PIPT 方式にするほうが簡単だからです。
しかし、もうひとつ VIPT 方式には問題があります。それはマルチプロセッサに向いていないというものです。
『Cache Coherence 問題の解決方法』のハードウェアでなんとかする方法では、スヌープが行われることを説明しました。スヌープでは、 DEVICE や他の CPU からのアクセス要求アドレスを CACHE に通知して各々の CACHE は通知されたアドレスの内容がキャッシュされているかどうかを調べる必要があります。
Fig.2 Hardware Solution to Cache Coherence Problem 1-2
このスヌープアドレスが物理アドレスの場合、VIPT 方式だと 物理アドレスを仮想アドレスに変換してから CACHE を調べる必要があります。物理アドレスと仮想アドレスが1対1ならばテーブルだけで済むかもしれませんが、一つの物理アドレスに複数の仮想アドレスを割り当てた場合を想定すると実装の難易度が爆上がりします。
このスヌープアドレスを仮想アドレスにするという選択肢もありますが、それだと Cache Aliasing 問題は未解決のままだし、MMU をどこに配置するかとか、その管理をどうするのかという問題があります。
というわけで、昨今のマルチプロセッサ全盛の時代では、Cache Coherence 問題はハードウェアでなんとかする方法が主流になっており、その場合は VIPT 方式は適していないのです。