5
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

LIFULLAdvent Calendar 2023

Day 7

RustのAllocatorを自作してみる

Last updated at Posted at 2023-12-07

C++やRustのコレクションのコードを読んでいるときに、よく Allocator というものを目にしていたのですが、これは何なんだろうって思っていたので、調べつつsampleのアロケータを書いて動かしてみました。

アロケーターとは

RustやC++などには、VectorやHashMap(c++ならmapなど)のコレクションが存在します。
使い方としてはこんな感じ

let mut vec = Vec::new();
for i in (0..100) {
    vec.push(i * i);
}

C言語だと、メモリをプログラマが確保/開放する必要あるわけですが、コレクションでは自分でメモリを確保したりはしません。
とはいえ、プログラムなのでメモリを管理する必要があります。

そこでコレクションのメモリを管理してくれるのがアロケータ(という理解)です。

Vectorに限定して話を進めると、Vectorは内部的には先頭へのポインタとvectorのサイズ,vectorのキャパシティを持っています。
キャパシティというのは、要素が追加されるたびにメモリのアロケーションをすると効率が悪いため、まとめて確保している要素数のことです。

要素が追加される場合は以下のような流れになります

そして、Vectorのスコープが終わるときに、自動的にVectorが保持しているメモリが開放されます。

つまりアロケータは最低限の機能として指定サイズのメモリ確保と、その領域の開放が必要になります。
それを定義したTraitが GlobalAlloc です。

pub unsafe trait GlobalAlloc {
    unsafe fn alloc(&self, layout: Layout) -> *mut u8;
    unsafe fn dealloc(&self, ptr: *mut u8, layout: Layout);

    // allocとdeallocを使ったデフォルト実装がある
    unsafe fn alloc_zeroed(&self, layout: Layout) -> *mut u8;
    unsafe fn realloc(&self, ptr: *mut u8, layout: Layout, new_size: usize) -> *mut u8;
}

サンプルのAllocatorを実装してみる

公式ドキュメントに記載されている Counter アロケータを作ってみます。

struct Counter;

static ALLOCATED: AtomicUsize = AtomicUsize::new(0);

unsafe impl GlobalAlloc for Counter {
    unsafe fn alloc(&self, layout: Layout) -> *mut u8 {
        let ret = System.alloc(layout);
        if !ret.is_null() {
            ALLOCATED.fetch_add(layout.size(), Ordering::Relaxed);
        }
        ret
    }

    unsafe fn dealloc(&self, ptr: *mut u8, layout: Layout) {
        System.dealloc(ptr, layout);
        ALLOCATED.fetch_sub(layout.size(), Ordering::Relaxed);
    }
}

#[global_allocator]
static A: Counter = Counter;

#[global_allocator] で、グローバルアロケータに登録しています。

このCounterアロケータは、allocdeallocが呼ばれたときに、要求されたサイズを、ALLOCATED変数に加算/減算して、現在のメモリ確保量を記録しています。

どれだけメモリが確保されているのかを表示してみます。

fn reset_counter() {
    ALLOCATED.store(0, Ordering::Relaxed);
}

fn print_alloc() {
    println!("allocated: {}", ALLOCATED.load(Ordering::Relaxed),);
}

fn main() {
    reset_counter();
    let vec = (1..1000).map(|i| i).collect::<Vec<_>>();
    print_alloc();

    reset_counter();
    let mut vec = Vec::new();
    for i in 1..1000 {
        vec.push(i);
    }
    print_alloc();

    reset_counter();
    let mut vec = Vec::with_capacity(1000);
    for i in 1..1000 {
        vec.push(i);
    }
    print_alloc();
}

$ cargo run
allocated: 3996
allocated: 4096
allocated: 4000
  1. mapで生成する
  2. capacityを指定せずに順次pushする
  3. capacityを指定して順次pushする

若干の違いが現れました。

Rust Playgroundを貼っておきます。

ちょっと機能を足してみる

これだけだと味気ないので、ちょっと機能を足してみます。
合計アロケートサイズだけじゃなく、アロケート回数もカウントするようにしてみます。

diff --git a/src/main.rs b/src/main.rs
index 4528bd8..c731b65 100644
--- a/src/main.rs
+++ b/src/main.rs
@@ -73,12 +73,14 @@ unsafe impl Allocator for FixedSizeAllocator {
 struct Counter;

 static ALLOCATED: AtomicUsize = AtomicUsize::new(0);
+static ALLOCATE_COUNT: AtomicUsize = AtomicUsize::new(0);

 unsafe impl GlobalAlloc for Counter {
     unsafe fn alloc(&self, layout: Layout) -> *mut u8 {
         let ret = System.alloc(layout);
         if !ret.is_null() {
             ALLOCATED.fetch_add(layout.size(), Ordering::Relaxed);
+            ALLOCATE_COUNT.fetch_add(1, Ordering::Relaxed);
         }
         ret
     }
@@ -94,10 +96,15 @@ static A: Counter = Counter;

 fn reset_counter() {
     ALLOCATED.store(0, Ordering::Relaxed);
+    ALLOCATE_COUNT.store(0, Ordering::Relaxed);
 }

 fn print_alloc() {
-    println!("allocated: {}", ALLOCATED.load(Ordering::Relaxed),);
+    println!(
+        "allocate count: {}, allocated: {}",
+        ALLOCATE_COUNT.load(Ordering::Relaxed),
+        ALLOCATED.load(Ordering::Relaxed)
+    );
 }

 fn main() {

ALLOCATE_COUNTの変数を追加し、allocのタイミングで1足すようにしてみました。

ついでに要素数を 100000 に増やして実行してみました。

$ cargo run
allocate count: 1, allocated: 799992
allocate count: 16, allocated: 1048576
allocate count: 1, allocated: 800000

mapcollectするパターンと、最初にwith_capacityで確保しておくパターンでは1回しかallocは呼ばれていません。
確保されたメモリ量も明らかにまとめて取得しておくほうが少ないです。
なのでサイズが事前にわかっている場合は with_capacity で確保しておくと良さそうです。

このようにRustではグローバルアロケータの挙動を自分で作ることができるため、例えばOSが無いような環境でプログラムが使えるメモリ領域が固定アドレスで決まっていてもそこにコレクションを使用することができます。

まとめ

アロケータとは、メモリ管理を抽象化してくれるものでした。
コレクションが内部でメモリを要求した際に allocが呼ばれ、メモリを開放する際にdeallocが呼ばれることがわかりました。

次回はコレクションごとにアロケータを差し替えてみようと思います。

5
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?