2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

and factory.incAdvent Calendar 2024

Day 21

GitHub ActionsとGeminiでSQLレビューの自動化を試作してみた

Last updated at Posted at 2024-12-20

はじめに 👋

みなさん、運用などで使用するSQLの保守って大変じゃないですか?

プロダクトコードであれば、ユニットテストなどを作って保守するところですが、手で叩くSQLのテストを作る優先度は落ちがちで叩く際に初めてSQLが壊れていることに気付きがちじゃないでしょうか。非エンジニアであれば余計に気付きづらいです。
そこで今回は、GitHub ActionsGoogle Gemini AIを組み合わせて、SQLレビューを自動化するプロトタイプを試作してみました!

実現したいこと 🎯

  1. PRでSQLファイルが変更されたら自動でレビュー
  2. 文法エラーや参照整合性の問題を検出
  3. パフォーマンス上の懸念点を指摘
  4. スキーマ変更時は既存SQLへの影響も確認

これらを実現することで、SQLレビューの効率化と品質向上を目指します。

前提

  • /db/checker.sql というテーブルスキーマを記述しているSQLがコミットされている
  • /sql/*.sql にSQLファイルをコミットしていく運用

システム概要 🔍

  1. PRでSQLファイルが変更される
  2. GitHub Actionsが起動
  3. Gemini AIがSQLをレビュー
  4. 結果をPRにコメント

この流れで、SQLの変更が自動的にレビューされ、即座にフィードバックが得られます。

実装のポイント 💡

1. レビュー結果を3段階(OK/Warning/Critical)で判定

レビュー結果は以下の3段階で評価します。

  • OK: 問題なし
  • Warning: パフォーマンスや保守性に改善の余地あり
  • Critical: 文法エラーや実行不可能な重大な問題あり

2. スキーマ変更の検出

スキーマ定義ファイルが変更されたかを検出し、必要に応じて既存のSQLにも影響がないかを確認します。

3. 使用するLLM

弊社ではChatGPTのTeamプランに加入しているので、GPT4oのAPIでもよいのですが、gemini-2.0-flash-expが2024年12月現在無料とのことなので、そちらを使います...。この性能が無料って一体全体どうなっているんでしょうか。ただ無料枠は学習に使用されるそうなので、ご注意ください。従量課金の場合はされないそうです。

3. プロンプト

以下のプロンプトをリクエストでGeminiのAPIに送ります。


# MySQL SQL Review Prompt

## レビュー概要
MySQLの専門家として、以下のSQLをレビューし、問題の重要度を判定してください。
- サーバーバージョン: ${MYSQL_VERSION}
- レビュー対象: SQLファイルの変更
- スキーマ変更: ${SCHEMA_CHANGED}
- 目的: SQL品質の確保
  
## 対象

### スキーマ定義
${CHECKER_SQL_CONTENT}

### 変更・追加SQL
${NEW_SQL_CONTENT}

### 既に存在するSQL(スキーマ変更時のみチェック)
${EXISTING_SQL_CONTENT}

## レビュー方針
1. 問題の重要度を3段階で判定
   - 🔴 Critical: 以下のいずれかに該当する場合。
     - SQL文法エラーにより実行不可能
     - 存在しないテーブルやカラムの参照
     - スキーマ変更時に既存SQLが動作しなくなる破壊的変更
   - 🟡 Warning: 以下のような改善推奨事項
     - パフォーマンス上の問題(インデックス未使用など)
     - N+1クエリの可能性
     - より良い代替手段が存在
   - 🟢 OK: 以下の全てを満たす場合
     - SQL文が文法的に正しい
     - 全てのテーブル・カラム参照が有効
     - 重大なパフォーマンス問題がない

2. 変数とプレースホルダーの扱い
   - @や:で始まる変数は定義済みとして扱う
   - プレースホルダーの値は考慮せず、構文のみ確認

3. 重要度Criticalに該当するかを最重要でチェックしてください。

4. パフォーマンスに影響があっても実行自体が可能な場合はCriticalではありません。Warningで報告してください。軽微だと考えられる場合はOKとしてください。

5. 以下のいずれかの形式で報告:

# 🟢 Check Result: OK

確認済み:
- 基本的な文法エラーなし
- テーブル・カラムの参照整合性を確認
- 重大なパフォーマンス問題なし

または

# 🟡 Check Result: Warning

## ⚠️ パフォーマンス警告

<details>
<summary>📄 sql/example.sql</summary>

### 📝 内容
パフォーマンス改善の提案内容

### 🛠️ 推奨対応
```sql
-- 推奨されるコード例
```

</details>

または

# 🔴 Check Result: Critical

## 検出された重大な問題:

<details>
<summary>📄 sql/example.sql</summary>

### ❗ 問題の概要
文法エラーやテーブル参照の誤りなど

### 📍 場所
[ファイルパス]:行番号

### 📝 詳細
具体的な問題の説明

### 💥 影響
想定される影響

### 🛠️ 修正案
```sql
-- 修正後のコード例
```

</details>



GitHub Actions ワークフローの設定

以下は、GitHub ActionsでSQLレビューを自動化するためのワークフロー設定です。
詳細の説明は長くなりそうなので割愛させていただきます:bow:

name: SQL Review

# 必要な権限を明示的に指定
permissions:
  issues: write
  contents: read
  pull-requests: write

# PRの作成・更新時のみ実行
on:
  pull_request_target:
    types: [opened, synchronize, reopened]
    paths:
      - 'sql/**.sql'    # SQLディレクトリ配下の全SQLファイル
      - 'db/checker.sql' # スキーマ定義ファイル

jobs:
  review:
    name: Review SQL Changes
    runs-on: ubuntu-latest
    timeout-minutes: 10

    env:
      MYSQL_VERSION: '8.0'
      MODEL_NAME: 'gemini-2.0-flash-exp'

    steps:
      - name: Checkout PR Head
        uses: actions/checkout@v4
        with:
          ref: ${{ github.event.pull_request.head.sha }}
          fetch-depth: 0
          persist-credentials: false

      - name: Analyze SQL Changes
        id: analyze
        run: >-
          set -euo pipefail;
          
          BASE_SHA="${{ github.event.pull_request.base.sha }}";
          HEAD_SHA="${{ github.event.pull_request.head.sha }}";
          
          # スキーマファイルの変更有無をチェック
          SCHEMA_CHANGED=$(git diff --name-only "$BASE_SHA" "$HEAD_SHA" -- 'db/checker.sql' | grep -q . && echo 'true' || echo 'false');
          echo "schema_changed=${SCHEMA_CHANGED}" >> "$GITHUB_OUTPUT";
          
          # スキーマ変更があれば既存SQLすべてをチェック、なければ差分のみ
          if [ "$SCHEMA_CHANGED" = "true" ]; then
            find sql -type f -name "*.sql" -print0 | xargs -0 realpath --relative-to=. > sql_files.txt;
          else
            git diff --name-only "$BASE_SHA" "$HEAD_SHA" -- 'sql/*.sql' > sql_files.txt;
          fi;
          
          # 対象ファイルがない場合はスキップ
          if [ ! -s sql_files.txt ]; then
            echo "skip=true" >> "$GITHUB_OUTPUT";
            echo "No SQL files to review.";
            exit 0;
          fi

      - name: Prepare Review Content
        if: steps.analyze.outputs.skip != 'true'
        id: prepare
        run: >-
          set -euo pipefail;
          
          # スキーマ変更フラグを設定
          echo "SCHEMA_CHANGED=${{ steps.analyze.outputs.schema_changed }}" >> "$GITHUB_ENV";
          
          # スキーマファイル内容を環境変数へ
          if [ -f "db/checker.sql" ]; then
            {
              echo "CHECKER_SQL_CONTENT<<EOF";
              cat "db/checker.sql" | sed 's/`/\\`/g';
              echo "EOF";
            } >> "$GITHUB_ENV";
          fi;
          
          # 新規・変更SQLファイルの内容を環境変数へ
          {
            echo "NEW_SQL_CONTENT<<EOF";
            while IFS= read -r file; do
              [ -f "$file" ] || continue;
              echo "-- File: $file";
              cat "$file" | sed 's/`/\\`/g';
              echo;
            done < sql_files.txt;
            echo "EOF";
          } >> "$GITHUB_ENV";
          
          # スキーマ変更時には、既存SQL(変更前の内容)も環境変数へ
          if [ "${{ steps.analyze.outputs.schema_changed }}" = "true" ]; then
            {
              echo "EXISTING_SQL_CONTENT<<EOF";
              while IFS= read -r file; do
                echo "-- File: $file";
                git show "${{ github.event.pull_request.base.sha }}:$file" 2>/dev/null | sed 's/`/\\`/g' || true;
                echo;
              done < sql_files.txt;
              echo "EOF";
            } >> "$GITHUB_ENV";
          fi

      - name: Review SQL with Gemini
        if: steps.analyze.outputs.skip != 'true'
        id: review
        env:
          GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
        run: >-
          set -euo pipefail;

          # Gemini AI へのプロンプトを組み立て
          PROMPT=$(cat .github/workflows/prompts/sql_review.md | envsubst);

          echo "=== Debug: Generated Prompt ===";
          echo "$PROMPT";
          echo "=== End Debug ===";

          RESPONSE=$(curl -sS -w "\n%{http_code}" \
            "https://generativelanguage.googleapis.com/v1beta/models/${MODEL_NAME}:generateContent?key=${GEMINI_API_KEY}" \
            -H "Content-Type: application/json" \
            -H "User-Agent: GitHub-Action-SQL-Review" \
            -d '{
              "contents": [{
                "parts": [{
                  "text": "'"$PROMPT"'"
                }]
              }]
            }');

          HTTP_STATUS=$(echo "$RESPONSE" | tail -n1);
          RESPONSE_BODY=$(echo "$RESPONSE" | sed '$ d');

          if [ "$HTTP_STATUS" != "200" ]; then
            echo "::error::API request failed with status ${HTTP_STATUS}";
            echo "Response: ${RESPONSE_BODY}";
            exit 1;
          fi;

          COMMENT=$(echo "$RESPONSE_BODY" | jq -r '.candidates[0].content.parts[0].text // empty');
          if [ -z "$COMMENT" ]; then
            echo "::error::Failed to extract comment from response";
            exit 1;
          fi;

          {
            echo "comment<<EOF";
            echo "$COMMENT";
            echo "EOF";
          } >> "$GITHUB_ENV"

      - name: Post Review Comment
        if: steps.analyze.outputs.skip != 'true'
        uses: actions/github-script@v7
        with:
          script: |
            const comment = process.env.comment;
            if (!comment) {
              core.setFailed('No comment to post');
              return;
            }
            
            await github.rest.issues.createComment({
              owner: context.repo.owner,
              repo: context.repo.repo,
              issue_number: context.issue.number,
              body: `${comment}`
            });

      - name: Check Review Result
        if: steps.analyze.outputs.skip != 'true'
        run: |
          # Geminiの出力から"Check Result"行を抽出し、OK/Warning/Criticalを判定
          CHECK_RESULT=$(echo "${{ env.comment }}" | grep -E "^# (🟢|🟡|🔴) Check Result:" | awk '{print $NF}')
          
          case "$CHECK_RESULT" in
            "OK")
              echo "SQLレビューが正常に完了しました"
              exit 0
              ;;
            "Warning")
              echo "::warning::SQLレビューで警告が検出されました"
              exit 0
              ;;
            "Critical")
              echo "::error::SQLレビューで重大な問題が検出されました"
              exit 1
              ;;
            *)
              echo "::error::不明なレビュー結果です: $CHECK_RESULT"
              exit 1
              ;;
          esac

実際のレビュー例 📝

実際にPRを出して確かめてみました。
ただの誤字の検出なのですが、まあまあいい感じに検出してくれています。

image.png

今後 🚀

ファイル数が多くなった時に期待通りに動くかを検証していこうと思っています。
Gemini1.5 Falshで100万トークンだったのでGemini 2.0ではさらに最大が上がっているのが期待できるのと、400テーブルほどで30万くらいのトークン数でしたので、動作自体は大丈夫なのかなと想定しています。厳しければSQLの変更箇所から該当テーブル定義のgrepなどしてAPIに渡すトークン数の削減が必要そうですね。

まとめ 📌

今回は、GitHub ActionsとGoogle Gemini AIを組み合わせて、SQLレビューを自動化する試作を行いました。今後、AIで自動化・補助できそうな開発サイクルにはどんどん適用していきたいですね。

参考資料 📚


2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?