More than 5 years have passed since last update.

Fortranで連想配列を書いた話

Last updated at 2019-02-25Posted at 2019-02-22

概要

実用的な連想配列の実装は大きく分けて二通り¹、平衡二分木とハッシュテーブルが候補に挙がる。それぞれの特徴を比較するとこんな感じだ。

	平衡二分木	ハッシュテーブル
概要	高さが要素数の対数程度になるような木を作る	キーにハッシュ関数を適用したものをインデックスとして配列にアクセス
挿入、削除、探索	O(log N) やや速い	O(1) 速い
k番目のキーにアクセス	できる	できない
留意点	単純な実装だとメモリ上非連続	キーが長い時はハッシュ関数が遅い²
その他	好き	あまり好きじゃない³

私のユースケースでは順序でアクセスする必要は低そうだが、本能に従って実装は平衡二分木を採用した。

あまり実装が重い木は正しく実装する自信が無いので、秋葉大先生の資料に倣ってtreapを採用した。親子関係はheap、左右関係は二分探索木になっていて、ランダムに優先度を割り振ることで確率的に平衡が保たれる。

複数のキーや値の型を使いたい。最近のFortranはポリモーフィズムにも対応しているらしいが、実装が複雑になりそう⁴なのでプリプロセッサで対応した。

連想配列を使える競プロの問題例

Trieという決定木アルゴリズムもある、らしい。 ↩
平衡二分木で必要な大小比較は文字列の最後まで検証しなくても結果が分かることが多い。1000文字以上になるとstd::unordered_mapよりstd::mapの方が速くなる（比較記事）。実際そんなに長いキーが必要になるユースケースは私には無さそうだが。 ↩
余分に配列を確保しておいてハッシュが衝突したら盥回しというのがちょっとね。 ↩
複数の組み込み型のスーパークラス的なものを自分で書いてそのインスタンスへのポインタを扱えば良い、という認識だが使ったことは無い。 ↩