小ネタの備忘録です。
チケット管理にBacklogを使ってます。プロジェクトが増えてきて、どのチケットが未処理なのかだったり誰がどのプロジェクトにアサインされているのかだったりをエクセルで操作、加工したかったのでさくっと個人開発🌝
Backlog APIを叩き、表形式にしてデータストアに格納する処理はGoで記述。GitHub Actionsを使って朝一回の処理を走らせる。最近ちょっとした定期処理はこのやりかたがコスト安なので好きです。
データストア
Azure Table Storageにしました。
Azure Table StorageであればエクセルのPower Queryコネクタで表形式のデータを簡単に引っ張ってこれるし、なんたって安い。
調べてみるとAzure Table Storageとほぼ同様にAzure Cosmos for Tableという選択肢もあるとの事。ふむふむ。
ざっくり比較すると以下のような感じ。
1. スピード (待ち時間)
-
Azure Table Storage
- 高速だけど、正確な待ち時間の上限は決まっていない
-
Azure Cosmos DB for Table
- 世界中どこでも超高速。読み取りは10ミリ秒以下、書き込みは15ミリ秒以下
2. 処理能力 (スループット)
-
Azure Table Storage
- 最大1秒に20,000回の操作まで可能
-
Azure Cosmos DB for Table
- 1秒に1,000万回以上の操作も対応。必要に応じて処理能力を確保
3. グローバル対応
-
Azure Table Storage
- 主に1つの地域で利用。オプションでバックアップ用の読み取り地域も追加可能
-
Azure Cosmos DB for Table
- 世界中30以上の地域にデータを分散
4. データ検索 (インデックス作成)
-
Azure Table Storage
-
PartitionKey
とRowKey
に対するインデックスのみ
-
-
Azure Cosmos DB for Table
- 全てのデータに自動でインデックスがつく
5. クエリの速度
-
Azure Table Storage
- プライマリキーで高速検索、その他はスキャンになる
-
Azure Cosmos DB for Table
- 自動インデックスでクエリが速い
6. データの整合性
-
Azure Table Storage
- プライマリリージョンは厳密な整合性、セカンダリは最終的な整合性
-
Azure Cosmos DB for Table
- 5つの整合性オプションから選べるので、柔軟に対応可能
7. コスト
-
Azure Table Storage
- 使用量に応じたシンプルな料金
-
Azure Cosmos DB for Table
- 使用量に応じた料金か、予め決めた容量に応じた料金のいずれかを選択
8. 信頼性 (SLA)
-
Azure Table Storage
- 99.99%の可用性
-
Azure Cosmos DB for Table
- 単一リージョンとマルチリージョンの両方のアカウントで
緩やかな整合性
を使用した場合、99.99%
の可用性を保証 - マルチリージョンのアカウントで読み取り操作に対して
99.999%
の可用性を保証
- 単一リージョンとマルチリージョンの両方のアカウントで
ふむむー、パフォーマンス的にはCosmos DB for Table。
また、クエリ操作に関してもCosmos DBのほうが優れているが、今回はテーブル間のJoinだったりソートだったりはエクセルでやるのでそこまでこだわらない。
コストはどちらも使用料に応じた課金体系だが、ざっくりAzure Table Storageのほうが安い。よってAzure Table Storageに決定。
SDK
SDKパッケージはAzure Cosmos DB for Table と Table Storage の両方で機能する。
Cosmos DBに移行したくなったとしてもアカウント名、接続キー、エンドポイントを書き換えればよいだけなので、移行も簡単🙌
エクセルへのインポート
あとはエクセルでポチポチするだけ
データタブからテーブルストレージを選択。
続けてストレージアカウント名とアクセスキーを入力。
データの変換をクリックし、Content列を展開して必要な列を選択する。
最後に「閉じて読み込む」でインポート完了。
さいごに
Azure Cosmos for Tableの存在を知れて試せたのは収穫でした😄
という事でちょっとした表形式のデータはAzure Table Storageオススメです