はじめに
ChatGPT Plus / Pro に含まれる Code Interpreter(Advanced Data Analysis) は、CSV や Excel ファイルをアップロードし、自然言語で指示するだけで、Python コードを実行し、グラフ化や統計処理を行う機能です。
この記事では、業務でよく使う5つの「型」を、すぐに使えるプロンプトとともに紹介します。
Code Interpreter の特徴と使い始め
ChatGPT 上で「+」ボタンからファイルをアップロードすると、ChatGPT がバックグラウンドで Python の実行環境を立ち上げ、コードを作成して実行します。
特徴:
- Pandas / NumPy / Matplotlib / Seaborn / scikit-learn などが利用可能
- グラフ生成、統計計算、機械学習モデルに対応
- ファイルサイズの上限あり(数十 MB 程度)
- 結果は対話形式で深掘り可能
型 1:売上データの月次推移分析
CSV をアップロードし、次のプロンプトを使用します。
このファイルは月次売上データです(columns: month, revenue, category)。
以下を実行してください:
1. 月別の総売上を折れ線グラフで可視化
2. カテゴリ別の売上構成比を最新月で円グラフ化
3. 前年同月比を計算、上昇 / 下降カテゴリを表で
4. 異常値(前月比 ±50% 超)の月とカテゴリを抽出
ChatGPT が Python コードを作成し、グラフ画像と表を返します。手作業で30分かかる作業が1分で完了します。
型 2:A/B テスト結果の統計検定
以下は A/B テストの結果データです(columns: variant, conversions, visitors)。
実行してほしいこと:
1. それぞれの CVR(コンバージョン率)を計算
2. 二群比率の検定(z 検定)を実行、p 値を提示
3. 統計的有意差があるか判断(有意水準 0.05)
4. 95% 信頼区間を計算
5. 結果を「データサイエンティストではない人にも伝わる」言葉で要約
統計の知識がなくても、検定結果を理解できます。マーケティングや UX 改善の意思決定に役立ちます。
型 3:ログファイルからの異常検出
以下はサーバーログです(CSV 形式、columns: timestamp, status_code, response_time, endpoint)。
以下を分析してください:
1. ステータスコード別の件数を集計
2. レスポンスタイムの分布をヒストグラムで可視化
3. p99 レイテンシが 5 秒を超えるエンドポイントを抽出
4. 5xx エラーが急増した時間帯を検出
5. 改善優先度の高い 3 つのエンドポイントを推奨
数千行のログから、注目すべき異常を自動で抽出します。この型を使って「夜間のバッチが失敗している」現象を発見しました。
型 4:顧客リストのセグメンテーション
以下は顧客リストです(columns: customer_id, age, gender, last_purchase_amount, last_purchase_days_ago, total_purchase_count)。
以下を実行してください:
1. RFM 分析(Recency / Frequency / Monetary)でセグメンテーション
2. 各セグメントの規模(人数)と平均単価を表で
3. K-means で 5 クラスタに分割、クラスタ別の特徴を要約
4. マーケ施策の優先度を 5 段階で提案
CRM ツールに頼ると10万円かかる分析を、ChatGPT で5分で実行できます。完璧ではありませんが、初期スクリーニングには十分です。
型 5:機械学習モデルの即席プロトタイプ
以下は不動産価格データです(columns: area, rooms, age, distance_to_station, price)。
以下を実行してください:
1. 特徴量エンジニアリング:必要なら新規列を追加
2. 線形回帰、ランダムフォレスト、XGBoost で価格予測モデルを訓練
3. R² と MAE で精度を比較
4. 特徴量重要度を可視化
5. 「次に取得すべきデータ」の提案(重要度の低い列の代わりに何が必要か)
scikit-learn の知識があれば1時間で書ける処理を、ChatGPT に依頼すると5分で結果が得られます。プロトタイピングには十分で、本番モデルはエンジニアが作成する前提です。
注意点:機密データの取り扱い
Code Interpreter で処理したデータは、デフォルトで OpenAI に送信されます。注意点:
- 顧客名・個人情報・社内機密情報は 入力する前に匿名化
- 設定画面で「モデル改善のためにデータを使用」を オフ
- それでも不安なら、Claude Pro の Analysis 機能(学習除外がデフォルト)が安心
- 企業データは Code Interpreter 系を使わない選択肢も検討
業務に組み込む際のベストプラクティス
- テンプレを保存:ChatGPT Projects や GPTs に上記 5 型を登録
- データを匿名化してからアップロード:社内メンバー用にスクリプト化
- 結果は必ず人間がレビュー:ハルシネーション、統計の誤解釈に注意
- Excel に Python 結果を貼る:最終アウトプットはチームに共有しやすい形式に
まとめ
Code Interpreter は「Python を書けない非エンジニアでもデータ分析できる」ツールではなく、「Python を書けるエンジニアが分析時間を 10 分の 1 にできる」ツールです。
私が運営している AI 比較メディアでは、データ分析 AI の比較や、業界別の活用ガイドを公開しています:
- データ分析 AI 比較:ChatGPT Code Interpreter / Claude Analysis / Julius
- マーケター必携 AI ツール 10 選
- 経理・会計職の AI 活用ガイド
参考になれば幸いです。
※ 仕様は 2026-05 時点のものです。データの取り扱いは社内ガイドラインに従ってください。