ChatGPT Code Interpreter でデータ分析を半自動化する 5 つの型

Posted at 2026-05-26

はじめに

ChatGPT Plus / Pro に含まれる Code Interpreter（Advanced Data Analysis） は、CSV や Excel ファイルをアップロードし、自然言語で指示するだけで、Python コードを実行し、グラフ化や統計処理を行う機能です。

この記事では、業務でよく使う5つの「型」を、すぐに使えるプロンプトとともに紹介します。

Code Interpreter の特徴と使い始め

ChatGPT 上で「+」ボタンからファイルをアップロードすると、ChatGPT がバックグラウンドで Python の実行環境を立ち上げ、コードを作成して実行します。

特徴：

Pandas / NumPy / Matplotlib / Seaborn / scikit-learn などが利用可能
グラフ生成、統計計算、機械学習モデルに対応
ファイルサイズの上限あり（数十 MB 程度）
結果は対話形式で深掘り可能

型 1：売上データの月次推移分析

CSV をアップロードし、次のプロンプトを使用します。

このファイルは月次売上データです（columns: month, revenue, category）。

以下を実行してください：
1. 月別の総売上を折れ線グラフで可視化
2. カテゴリ別の売上構成比を最新月で円グラフ化
3. 前年同月比を計算、上昇 / 下降カテゴリを表で
4. 異常値（前月比 ±50% 超）の月とカテゴリを抽出

ChatGPT が Python コードを作成し、グラフ画像と表を返します。手作業で30分かかる作業が1分で完了します。

型 2：A/B テスト結果の統計検定

以下は A/B テストの結果データです（columns: variant, conversions, visitors）。

実行してほしいこと：
1. それぞれの CVR（コンバージョン率）を計算
2. 二群比率の検定（z 検定）を実行、p 値を提示
3. 統計的有意差があるか判断（有意水準 0.05）
4. 95% 信頼区間を計算
5. 結果を「データサイエンティストではない人にも伝わる」言葉で要約

統計の知識がなくても、検定結果を理解できます。マーケティングや UX 改善の意思決定に役立ちます。

型 3：ログファイルからの異常検出

以下はサーバーログです（CSV 形式、columns: timestamp, status_code, response_time, endpoint）。

以下を分析してください：
1. ステータスコード別の件数を集計
2. レスポンスタイムの分布をヒストグラムで可視化
3. p99 レイテンシが 5 秒を超えるエンドポイントを抽出
4. 5xx エラーが急増した時間帯を検出
5. 改善優先度の高い 3 つのエンドポイントを推奨

数千行のログから、注目すべき異常を自動で抽出します。この型を使って「夜間のバッチが失敗している」現象を発見しました。

型 4：顧客リストのセグメンテーション

以下は顧客リストです（columns: customer_id, age, gender, last_purchase_amount, last_purchase_days_ago, total_purchase_count）。

以下を実行してください：
1. RFM 分析（Recency / Frequency / Monetary）でセグメンテーション
2. 各セグメントの規模（人数）と平均単価を表で
3. K-means で 5 クラスタに分割、クラスタ別の特徴を要約
4. マーケ施策の優先度を 5 段階で提案

CRM ツールに頼ると10万円かかる分析を、ChatGPT で5分で実行できます。完璧ではありませんが、初期スクリーニングには十分です。

型 5：機械学習モデルの即席プロトタイプ

以下は不動産価格データです（columns: area, rooms, age, distance_to_station, price）。

以下を実行してください：
1. 特徴量エンジニアリング：必要なら新規列を追加
2. 線形回帰、ランダムフォレスト、XGBoost で価格予測モデルを訓練
3. R² と MAE で精度を比較
4. 特徴量重要度を可視化
5. 「次に取得すべきデータ」の提案（重要度の低い列の代わりに何が必要か）

scikit-learn の知識があれば1時間で書ける処理を、ChatGPT に依頼すると5分で結果が得られます。プロトタイピングには十分で、本番モデルはエンジニアが作成する前提です。

注意点：機密データの取り扱い

Code Interpreter で処理したデータは、デフォルトで OpenAI に送信されます。注意点：

顧客名・個人情報・社内機密情報は 入力する前に匿名化
設定画面で「モデル改善のためにデータを使用」をオフ
それでも不安なら、Claude Pro の Analysis 機能（学習除外がデフォルト）が安心
企業データは Code Interpreter 系を使わない選択肢も検討

業務に組み込む際のベストプラクティス

テンプレを保存：ChatGPT Projects や GPTs に上記 5 型を登録
データを匿名化してからアップロード：社内メンバー用にスクリプト化
結果は必ず人間がレビュー：ハルシネーション、統計の誤解釈に注意
Excel に Python 結果を貼る：最終アウトプットはチームに共有しやすい形式に

まとめ

Code Interpreter は「Python を書けない非エンジニアでもデータ分析できる」ツールではなく、「Python を書けるエンジニアが分析時間を 10 分の 1 にできる」ツールです。

私が運営している AI 比較メディアでは、データ分析 AI の比較や、業界別の活用ガイドを公開しています：

参考になれば幸いです。

※ 仕様は 2026-05 時点のものです。データの取り扱いは社内ガイドラインに従ってください。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up