LoginSignup
10
8

生成AIでデータ分析やコーディングはどう変わるのか?

Last updated at Posted at 2023-08-26

こちらでお話しした内容です。

自己紹介とイベント案内

Databricks DATA+AI WORLD TOUR Tokyo

Databricks Japan最大のイベント!

日時: 2023年9月14日(木)
場所: ANA インターコンチネンタルホテル東京
URL: https://dbricks.co/3QOCKGs
イベント概要:
データブリックスジャパン、最大の年次イベントです!お客様、弊社社長によるキーノートスピーチ、Databricksハンズオン、テクニカルブレークアウトセッションなどを対面で実施します!生成AIの話題も多数カバーしています!

JEDAI勉強会 第4回: 生成AIとは何か?

日時: 2023年9月27日(水)
URL: https://jedai.connpass.com/event/293793/
イベント概要 田辺三菱製薬様にご登壇いただき、生成AI活用の取り組みについてお話しいただきます。

生成AIのユースケース

知性のある会話、クリエイティブなテキスト、コード生成と言ったシーンで活用されています。

Screenshot 2023-08-26 at 17.37.35.png

  • コンテンツ生成
  • 質問/回答
  • バーチャルアシスタント
  • コンテンツのパーソナライゼーション
  • 言語スタイルの転換
  • ストーリーテリング、詩、クリエイティブなライティング
  • 翻訳
  • コード生成 / オートコンプリート

コード生成や開発者の生産性向上の目的での活用が進んでいます。

  • コード補完、定型コードの生成
  • エラー検知やデバッグ
  • 言語間でのコード変換
  • コードのドキュメントの記述
  • 自動テスト
  • 自然言語でコード生成
  • コードを学習するためのバーチャル
  • コードアシスタント

生成AIのデータ分析やコーディングへの影響

学習曲線の改善、生産性の改善が見込まれます。

  • 自然言語による学習障壁の低減 : 自然言語を用いてコーディングを行えるようになることで、様々なデータ分析やコーディングの取り組みが容易なものとなります。
    自然言語から生成されたコードを確認することで理解が深まります。
  • 作業効率の改善 : エラーに遭遇したりコードの記述方法が不明な場合であっても、
    ドキュメントを首っ引きで調べるのではなく、生成AIから即座に修正案を提案してもらうことができ、効率的に作業を進めることができます。

English SDK for Apache Spark

Screenshot 2023-08-26 at 17.39.45.png

自然言語でApache Sparkを操作できるSDKが公開されています。

OpenAIのコンピューターサイエンティストであるA. Karpathyはこう述べました。

もっともホットな新たなプログラミング言語は英語です

これまでは、PythonやSQLを用いて技術者のみがプログラミングを行っていました。しかし、LLMの台頭によって自然言語を用いたプログラミングが可能となっています。

Screenshot 2023-08-26 at 17.42.09.png

英語(日本語)は新たなプログラミング言語です。

生成AIは新たなコンパイラです。

Pythonは新たなバイトコードです。

English SDK for Apache Sparkを用いることで、自然言語によるデータの変換、可視化、検証などが可能になります。
Screenshot 2023-08-26 at 17.42.35.png

このように、自然言語を用いたデータ操作が可能となっています。
Screenshot 2023-08-26 at 17.44.08.png

参考資料

Databricksアシスタント(LakehouseIQ)

よくある間違いは、ソフトウェアの問題すべてをLLMで解決しようとすることです。
Screenshot 2023-08-26 at 17.45.45.png

これ自体は問題ではありませんが、単にLLMアシスタントを追加するだけではうまく行きません。

Screenshot 2023-08-26 at 17.48.38.png

すべての企業では、自分の専門用語、データ、組織構造を持っています。固有の専門用語や同じ四半期でも会社によって定義が異なります。これらの違いを考慮せずにLLMに問い合わせを行っても、期待する結果は得られません。

前の quarter において Europe における DBU はいくらか

このようなクエリーを行った場合、例えば、Databricksの四半期は2月スタートですし、ヨーロッパの地域の区切り方も会社によって異なります。さらにはDBU(Databricks Unit)などは完全に社内固有の単語です。

このような問題を解決するために、我々はLakehouseIQを発表しました。これは、Databricksで活用されているデータ、ノートブックなどから企業固有の文脈を学習し、適切に動作するAIアシスタントです。
Screenshot 2023-08-26 at 17.49.03.png

まだ、こちらは正式提供されていませんが、先行的にDatabricksアシスタントが利用できるようになっています。こちらはノートブックで記述されているロジックやエラーなどから文脈を理解し、適切なアドバイスを行うAIアシスタントです。
Screenshot 2023-08-26 at 17.51.03.png

プログラミングの過程でアシスタントに問い合わせを行いアドバイスをもらうことができます。
Screenshot 2023-08-26 at 17.51.15.png

参考資料

今後の展望

コーディングやデータ分析の領域での自然言語の活用が進むと見ています。

  • 自然言語による学習障壁の低減 : プログラマだけではなくビジネスユーザーによるデータ分析、ロジック開発が進みます。
  • 作業効率の改善 : 複雑なロジックの開発スピードが改善し、企業における高度な機能の活用が促進し、さらなるビジネス価値創出につながります。

Databricksクイックスタートガイド

Databricksクイックスタートガイド

Databricks無料トライアル

Databricks無料トライアル

10
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
8