データサイエンティストにとって、ChatGPTはうまく利用することで非常に強力なツールになることは間違いありません。
近い将来、データサイエンティストの中でもChatGPTをうまく使いこなせる人とそうでない人の間には、大きな差が生まれるでしょう。
そこで、今後ChatGPTを上手に活用できるようにデータサイエンティストが必ず読むべき記事を紹介します!
ChatGPTの公式プラグイン「code interpreter」
データサイエンティストの業務を大きく変える可能性のある、ChatGPT公式プラグイン「code interpreter」について解説している記事です。
ファイルのアップロード機能を使うことで、チャット上にデータをアップロードし、そのデータに対してコードを実行することができるようになります。
また、作業の結果をcsvなどでダウンロードすることが可能です。
つまり、code interpreterのプラグインを使うことで、ChatGPT上でPythonコードを実行したり、ファイルのやり取りを行うことができるようになり、今まで以上にChatGPTが便利になるということです。
現在は、一部のユーザーにのみアルファ版として解放されています。
ChatGPTの仕組み
こちらは、MicrosoftのエンジニアがDS協会のセミナーで行った2時間の講演の動画で、データサイエンティストとして、ChatGPTの仕組みを知っておきたいという人におすすめの記事です
この講演では、ChatGPTの基本概念から始まり、後半部分では詳細な技術的な話題に深く踏み込んでいます。既にChatGPTについての知識がある人や、これから開発を進めていきたい方にとって、大変満足のいく内容となっています。
講演資料も公開されているので、一緒にチェックしてみてください。
ChatGPTの仕組みを解説しているおすすめ記事
データサイエンティストのためのChatGPT活用術
データサイエンティストが業務の効率を上げるためにChatGPTをどう活用できるかが解説されています。
ChatGPTを使って業務を効率化していきたいデータサイエンティストは必見の内容です。
データの前処理
ChatGPTのAPIを使って、苗字と名前の間にスペースがあったりなかったりするような整っていないデータの前処理を簡単に行えるかどうかを実験している記事です。
近い将来にデータサイエンティストは前処理を自分たちで行わなくても良い時代が訪れることを示唆しているような内容になっています。
データ抽出(SQL)
この記事では、やりたいことを簡潔に伝えるだけで、ChatGPTが自動的にSQLを生成してくれる様子を詳しく解説しています。
ちょっとしたコツを習得すれば、SQLに詳しくない人でもエンジニアやデータ分析者に頼らず、ChatGPTを活用してデータベースから必要な情報を引き出すことが可能になることを予感させてくれます
ダミーデータ作成
こちらの記事ではブラウザからのダミーデータ作成と、PythonでAPIを使ったダミーデータ作成について記載されています。
ChatGPTを使ったダミーデータ生成のおすすめ記事
予測モデル作成
こちらの記事ではChatGPTプラグイン「Notable」だけで、データ分析コンペに参加して予測モデルを作ってみた話が書かれています。
ほとんど全てをChatGPTに任せた時にどれくらいの精度の予測モデルを作ってくれるのかがストーリー立てて書かれているので非常に興味深いです。
ChatGPTを使った予測モデル作成のおすすめ記事
特徴量エンジニアリング
こちらの記事ではFXの価格予測モデルの精度向上のため、ChatGPTを活用して特徴量エンジニアリングを行っています。
結果としては、大きな精度向上は見られないものの、ChatGPTが自ら仮説検証を行うことにより大幅に時間短縮できていること自体が大きな成果だと考えられます。
アンサンブル学習
こちらの記事ではFXの価格予測モデルの精度向上を目指して、ChatGPTを使ってアンサンブル学習を実行しています。
精度向上に繋がっていませんが、ChatGPTの指示通りにコードを実行するだけで知識が全くなくてもアンサンブル学習を実装できるのは凄いですね。
数理最適化
こちらの記事では、物流ネットワークを最適化に関する問題をChatGPTと対話しながら担当者へのヒアリングと定式化をそれぞれやってもらうという実験をしています。
現時点ではまだまだ改善の余地がありそうですが、今後「数理最適化問題を解くときに適したプロンプト」が発見されればかなり実用的になるという印象です。
データ分析コンペ
こちらの記事では、なんと筆者の友人がデータサイエンスの初心者にも関わらず、ChatGPTにアドバイスをもらいながらデータ分析コンペで上位6.5%に入ったという衝撃的な内容が書かれています。
AIデータ分析ツール
この記事では、ChatGPTのようなAIを活用した最新のAIデータ分析ツールが紹介されています。
これらのツールの登場により、データサイエンティストの仕事が奪われるとはまた思いませんし、むしろこれらのツールを活用することで、データ分析の作業を大幅に効率化されます。
したがって、データサイエンティストはAI分析ツールによって仕事が奪われることを恐れるのではなく、これらのツールを上手に活用し、分析作業を効率化することが重要となってきます。
そのため、まずは現在どんなAIデータ分析ツールがあるのか、業務にはどのように活用できそうかを知っておくためにもこちらの記事をチェックするのがおすすめです。
最後に宣伝です!
データサイエンティストのために、CahtGPTをはじめとした生成AIを使ってデータ分析を効率化する情報をまとめたサイトを運営しています!
生成AI×データ分析に興味がある人はぜひこちらも覗いてもらえると嬉しいです!!
その他