データサインティストが仕事を奪われてしまうかもしれないほどに凄いAI分析ツールを紹介します。
どれくらいデータサイエンティストの仕事を奪う危険性があるかを星で表していますので、時間がない人は星が多いやつだけでもチェックしてみてください!
Code Interpreter(危険度:★★★★★)
「Code Interpreter」はChatGPTが提供する予定の新機能で、2023年6月現在は一部のユーザーにα版として利用が開放されています。
この機能を使用すると、ChatGPT上でPythonコードの実行や、ファイルのアップロード・ダウンロードが可能になります。最大で100MBまでのデータをアップロードし、そのデータに対してコードを実行できるのです。
また、作業の結果はCSVなどの形式でダウンロードできます。
OpenAIは、この「Code Interpreter」が「定量的、定性的な数学的問題の解決」や「データ分析と可視化」に有用だと述べています
さらに、既に利用しているユーザーからは、「データサイエンティストが不要になる」や「一人前のデータサイエンティストと同じ機能を持つ」という声が寄せられています。
データを読み込んで分析し、その結果を報告するまでの一連の作業が自動化できるこの機能が普及すれば、データサイエンティストが少なくとも部分的に不要になる可能性はかなり高いでしょう
以下に、実際に「Code Interpreter」を利用したユーザーの感想をいくつか紹介します。
簡単な指示だけで可視化&示唆出し
ChatGPT のコード インタープリター機能は、私がこれまで見た中で最も衝撃的なものです。
私がやったのは、SF の犯罪データの CSV をアップロードして、傾向を視覚化するように依頼したことだけです(!!)
まずこの方はCode Interpreterを用いて、サンフランシスコの犯罪データを含むCSVファイルをアップロードし、トレンドを視覚化するように指示した様子をツイートしています。
データをアップロードして、簡単な指示をするだけで、データの可視化やそのデータから読み取れること、考察などしてくれている様子がわかります。
単にCSVデータをアップロードして可視化するように指示しただけで、データの可視化やそのデータから読み取れることを教えてくれるのは凄いですよね
高度な分析も可能
ChatGPT コードインタープリターを使用して 300 時間の Spotify のお気に入りプレイリストを分析する
PCA分析用に誰かが作ったJupyterノートブックを使っていましたが、壊れてしまいました
GPTは、Spotify API からエクスポートする方法を示し、多次元 PCA および t-SNE 分析を実行し、私の好みをまとめてくれました。
こちらのツイートでは、Spotifyのお気に入りプレイリストのデータをAPIから読み込ませて簡単な指示を出すだけで、多次元PCAとt-SNE分析を実行して、ユーザーの好みをレポーティングしたことが述べられています。
データをアップロードするだけで、PCAやt-SNEといった高度な分析を行い、最終的にはその分析結果をレポートとしてまとめてくれているというのは驚きですよね
Code Interpreterに関するリンク
公式サイト
日本語での解説記事&α版利用への登録方法解説
Microsoft Fabric Copilot(危険度:★★★★☆)
「Microsoft Fabric Copilot」は、すべてのデータと分析ツールを統合するMicrosoftの新しい統合分析プラットフォームの一部の機能です。(2023年6月現在はプレビュー中)
ユーザーは「Microsoft Fabric Copilot」はを使うことで、データフローやデータパイプラインの作成から、コードや関数全体の生成、さらには機械学習モデルの構築や結果の可視化などデータ分析に関わるあらゆることをChatGPTのような会話形式で出来るようになります。
「Microsoft Fabric」自体が統合分析プラットフォームなので、保有しているデータにアクセスしやすいのも大きなメリットですね。
こちらはMicrosoftが公開したデモ動画です
デモ動画によるとこんな感じに簡単な指示を出すだけで、ダッシュボードを1から作ってくれるようです。
もしこのデモ動画のように自動で分析をしてくれるのだとしてたら本当にデータサイエンティストの仕事が変わることが予感されます
少なくとも、ジュニアデータサイエンティストとデータ分析の専門ではない人の差がほとんどなくなる可能性が示唆されています。
Microsoft Fabric Copilotに関するリンク
公式サイト
日本語での解説記事
Tableau GPT(危険度:★★★☆☆)
「Tableau GPT」は、世界中の多くのユーザーに使われているBIツール「Tableau」に搭載される生成AIを使った新機能です。
具体的な機能はまだ不明な部分が多いですが、ChatGPTのような会話形式で、データの分析やダッシュボードの作成が出来るようです。
またダッシュボードを使うユーザーはデータについての質問を行うことで、必要なデータに簡単にアクセス出来るようになるとのことです。
この機能がリリースされたら、ダッシュボードの作成はもうデータサイエンティストの仕事では無くなるのかもしれませんね。
BIツールの作成を中心に行なっているデータサイエンティストにとっては、この先の仕事が大きく変わるのは間違いないでしょう。
Tableau GPTに関するリンク
公式サイト
日本語での解説記事
Excel Copilot(危険度:★☆☆☆☆)
Microsoftは、自然言語処理技術を活用して、私たちの指示を理解し、AIが各種タスクを支援する新機能「Microsoft 365 Copilot」を開発しました。
この機能は、既存のMicrosoft 365の各アプリに組み込まれ、特に「Copilot in Excel」はExcel内で機能し、ユーザーの指示だけでAIがデータ分析や可視化を自動的に行います。
特筆すべき点は、Excel上で直接指示が出せることです。多くの業務が今でもExcelで管理されている中、Excelのデータに対して会話のように分析し、可視化できることは非常に便利です。
例えば、以下のような指示を出すだけで、AIが自動的にタスクを実行します
- 種類やチャネル別の売上高を分析して内訳表を作成する
- 売上低下の原因を推定し、結果をグラフにして視覚的に表示する
- 事業の成長率の変化が粗利益率にどう影響するかをモデル化する
さらに、売上の内訳を作成する、変数の影響を推定するグラフを生成する、成長率の変化の影響をモデル化するといった作業も、簡単な指示だけでAIがサポートします。
この新機能の導入により、データ分析の専門家でなくても、誰でも簡単に深い分析を行うことが可能になります。
ただし、Excelで行う範囲の分析が自動化されるだけなので、データサイエンティストにとっては必ずしも脅威になるわけではありません。
しかし、簡易的な分析については、データサイエンティストに仕事を依頼する必要性が減るでしょう。
Excel Copilotに関するリンク
公式サイト
日本語での解説記事
まとめ
以上がデータサインティストの存在を脅かす可能性がある、分析ツールです。
ご覧いただいた通り、コード生成、モデル作成、ダッシュボード作成などの作業パートや簡単な分析においては大部分がAIによって自動化される日は遠くないでしょう。
一方で、ビジネスの課題をデータ分析に落とし込む部分はまだAIには難しいため、この領域で価値を発揮できる人々がこれからも必要とされると予想されます。
ただ、これらのツールの登場により、すぐに全てのデータサイエンティストが不要になるわけでは無いでしょう。
ただ、現在も単純な分析やSQLやPythonのコーディングだけでしか価値を出せていないデータサイエンティストはこれらのツールによって代替されてしまうかもしれませんね。(そういう人をデータサイエンティストと呼んでいいかはさておき)
また、データサイエンティストがすぐに不要にはならないと思いますが、この先はこれらのツールを使いこなす能力が大きな差を生むことは間違いありません。
なので、これらのツールに対して危機感を持つというよりは、より使いこなすにはどうしたらいいかを今のうちから考えるために常にアンテナを張っておくことが大切になります。
例えば、コード作成や簡単な分析をAIに任せ、自分はAIが苦手な領域で価値を出せるデータサイエンティストと、コード作成や簡単な集計や分析に自身の時間を取られてしまうデータサイエンティストでは、アウトプットの差は明らかになるでしょう!
今回紹介しきれなかったAI分析ツールは以下で紹介しているので、良かったらこちらもご覧ください!