- AIでデータ分析-箱ひげ図:職種による給料の分布の違いを比較する
- 用いるデータの紹介
- まずはExploratoryで箱ひげ図を作成し結果を確認する
- 次にPythonで箱ひげ図を作成する
- 最後にAIの活用:chatGPTで箱ひげ図を作成する
- まとめ
AIでデータ分析-箱ひげ図:職種による給料の分布の違い
このノートは、分析においてAIを使って何ができて何ができないかを検証するために、実際に試した結果をまとめたノートです。
今回はAIを用いて職種による給料の分布の違いを分析していきたいと思います。
その際、chatGPTを用いて正しく箱ひげ図が表示されるのか試してみたいと思います。AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回検証に用いるデータのサンプルデータは従業員データです。サンプルデータはこちらからダウンロードできます。
1行が従業員1人のデータになっています。列情報としては年齢、性別、婚姻ステータス、部署、職種、給料などがあります。
まずはExploratoryを用いて実行し結果を確認する
まずは正しい結果を抑えるべく、Exploratoryを用いて箱ひげ図を作成します。
結果を見ると、この会社ではマネージャー、リサーチディレクターの給料が高くなっていることが分かります。作成にかかった時間は30秒でした。
次にPythonで箱ひげ図を作成する
次に同じことをPythonでやってみます。
結果を確認します。
同じ結果に対し、作成にかかった時間は10分でした。ここはプログラミングスキルによりますのでご参考までに。
最後にAIの活用:chatGPTで箱ひげ図を作成する
次に同じことをするため、chatGPTに従業員データをアップロードし、下記のようにプロンプトを入力し、実行します。
結果を確認します。
結果は正しく箱ひげ図は作れていそうです。しかし調べてみると今のところchatGPTでは図に日本語表記ができず、文字化けしてしまうようです。所要時間は30秒でした。
まとめ
今回は箱ひげ図を作成するにあたり、3つの方法を試しました。
1つ目はExproratoryを用いた方法と、2つ目はPythonを用いた方法、3つ目はAI(chatGPT)を用いた方法です。
結果はAIでも正しい箱ひげ図は作れますが、図に日本語表記ができないことを
確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析--箱ひげ図:職種による給料の分布の違い は以上となります!