0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ChatGPT Code Interpreter でデータ分析を半自動化する 5 つの型

0
Posted at

はじめに

ChatGPT Plus / Pro に含まれる Code Interpreter(Advanced Data Analysis) は、CSV や Excel ファイルをアップロードし、自然言語で指示するだけで、Python コードを実行し、グラフ化や統計処理を行う機能です。

この記事では、業務でよく使う5つの「型」を、すぐに使えるプロンプトとともに紹介します。

Code Interpreter の特徴と使い始め

ChatGPT 上で「+」ボタンからファイルをアップロードすると、ChatGPT がバックグラウンドで Python の実行環境を立ち上げ、コードを作成して実行します。

特徴:

  • Pandas / NumPy / Matplotlib / Seaborn / scikit-learn などが利用可能
  • グラフ生成、統計計算、機械学習モデルに対応
  • ファイルサイズの上限あり(数十 MB 程度)
  • 結果は対話形式で深掘り可能

型 1:売上データの月次推移分析

CSV をアップロードし、次のプロンプトを使用します。

このファイルは月次売上データです(columns: month, revenue, category)。

以下を実行してください:
1. 月別の総売上を折れ線グラフで可視化
2. カテゴリ別の売上構成比を最新月で円グラフ化
3. 前年同月比を計算、上昇 / 下降カテゴリを表で
4. 異常値(前月比 ±50% 超)の月とカテゴリを抽出

ChatGPT が Python コードを作成し、グラフ画像と表を返します。手作業で30分かかる作業が1分で完了します。

型 2:A/B テスト結果の統計検定

以下は A/B テストの結果データです(columns: variant, conversions, visitors)。

実行してほしいこと:
1. それぞれの CVR(コンバージョン率)を計算
2. 二群比率の検定(z 検定)を実行、p 値を提示
3. 統計的有意差があるか判断(有意水準 0.05)
4. 95% 信頼区間を計算
5. 結果を「データサイエンティストではない人にも伝わる」言葉で要約

統計の知識がなくても、検定結果を理解できます。マーケティングや UX 改善の意思決定に役立ちます。

型 3:ログファイルからの異常検出

以下はサーバーログです(CSV 形式、columns: timestamp, status_code, response_time, endpoint)。

以下を分析してください:
1. ステータスコード別の件数を集計
2. レスポンスタイムの分布をヒストグラムで可視化
3. p99 レイテンシが 5 秒を超えるエンドポイントを抽出
4. 5xx エラーが急増した時間帯を検出
5. 改善優先度の高い 3 つのエンドポイントを推奨

数千行のログから、注目すべき異常を自動で抽出します。この型を使って「夜間のバッチが失敗している」現象を発見しました。

型 4:顧客リストのセグメンテーション

以下は顧客リストです(columns: customer_id, age, gender, last_purchase_amount, last_purchase_days_ago, total_purchase_count)。

以下を実行してください:
1. RFM 分析(Recency / Frequency / Monetary)でセグメンテーション
2. 各セグメントの規模(人数)と平均単価を表で
3. K-means で 5 クラスタに分割、クラスタ別の特徴を要約
4. マーケ施策の優先度を 5 段階で提案

CRM ツールに頼ると10万円かかる分析を、ChatGPT で5分で実行できます。完璧ではありませんが、初期スクリーニングには十分です。

型 5:機械学習モデルの即席プロトタイプ

以下は不動産価格データです(columns: area, rooms, age, distance_to_station, price)。

以下を実行してください:
1. 特徴量エンジニアリング:必要なら新規列を追加
2. 線形回帰、ランダムフォレスト、XGBoost で価格予測モデルを訓練
3. R² と MAE で精度を比較
4. 特徴量重要度を可視化
5. 「次に取得すべきデータ」の提案(重要度の低い列の代わりに何が必要か)

scikit-learn の知識があれば1時間で書ける処理を、ChatGPT に依頼すると5分で結果が得られます。プロトタイピングには十分で、本番モデルはエンジニアが作成する前提です。

注意点:機密データの取り扱い

Code Interpreter で処理したデータは、デフォルトで OpenAI に送信されます。注意点:

  • 顧客名・個人情報・社内機密情報は 入力する前に匿名化
  • 設定画面で「モデル改善のためにデータを使用」を オフ
  • それでも不安なら、Claude Pro の Analysis 機能(学習除外がデフォルト)が安心
  • 企業データは Code Interpreter 系を使わない選択肢も検討

業務に組み込む際のベストプラクティス

  1. テンプレを保存:ChatGPT Projects や GPTs に上記 5 型を登録
  2. データを匿名化してからアップロード:社内メンバー用にスクリプト化
  3. 結果は必ず人間がレビュー:ハルシネーション、統計の誤解釈に注意
  4. Excel に Python 結果を貼る:最終アウトプットはチームに共有しやすい形式に

まとめ

Code Interpreter は「Python を書けない非エンジニアでもデータ分析できる」ツールではなく、「Python を書けるエンジニアが分析時間を 10 分の 1 にできる」ツールです。

私が運営している AI 比較メディアでは、データ分析 AI の比較や、業界別の活用ガイドを公開しています:

参考になれば幸いです。


※ 仕様は 2026-05 時点のものです。データの取り扱いは社内ガイドラインに従ってください。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?