3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【DataRobotの基本的な使い方】DataRobotシリーズ その1

Last updated at Posted at 2022-05-12

こんにちは。スキルアップAI編集部です。

「機械学習を行ってみたいんだけど、自分ではコードが書けないし、周りにそういうのが得意なエンジニアもいない」という場面に直面したことはありませんか?

今回はそのような時に役に立つ、ノーコードでAIを構築できる「DataRobot」についてご紹介します。
「DataRobot」を使うと、エンジニアやデータサイエンティストでなくてもデータドリブンな課題解決を行うことができるようになります。

<目次>
1.DataRobotとは?
2.DataRobotのアカウントの作成
3.DataRobotを用いた線形回帰モデルの作成
4.まとめ

1.DataRobotとは?

「DataRobot」は、DataRobot社が開発した機械学習自動化プラットフォームです。

このプラットフォームを用いると、従来手作業で行う必要のあった特徴量の前処理やモデルの選定などの、時間のかかる作業を自動化できます。そのため、データサイエンティストやエンジニアのようなAIに関する高度な知識をもった人材でなくても機械学習のモデルを構築できます。

2.DataRobotのアカウントの作成

DataRobotを使用するためには、まずDataRobotのアカウントを作成します。DataRobotでは有料のライセンスも用意されていますが、まずは無料で試せるトライアルから始めてみるのがよいでしょう。それにはこちらのリンク先でメールアドレスの登録を行います。メールアドレスを登録することで14日間トライアル環境を使用することができます。

3.DataRobotを用いた線形回帰モデルの作成

ここからはDataRobotの基本的な使い方についてご紹介します。

使用例として今回は、ダイヤモンドの重さの単位であるカラットと、その価格に関するデータを使って、ダイヤモンドの重さから価格を予測するモデルを作成したいと思います。
今回は、手動モードで線形回帰モデルを作成します。

下記の手順に従ってモデルの作成を行います。

  1. データの読み込み
  2. データを大まかに捉える
  3. モデリング
  4. モデリング性能の確認

まずは、データの読み込みから行います。

datarobot-1_01.png

datarobot-1_02.png

datarobot-1_03.png

datarobot-1_04.png

datarobot-1_05.png

以上でデータの読み込みが完了しました。

次に、読み込んだデータをDataRobot上で確認してみます。

datarobot-1_06.png

datarobot-1_07.png

datarobot-1_08.png

ここで、データの品質評価を確認します。
データの品質評価とは、問題を引き起こす可能性のあるポイントを報告する機能です。

偽装欠損値」では、データの加工などの過程で、元々欠損値であったところに望ましくない値が挿入されている可能性が報告されます。

過剰なゼロ」では、同じ列(特徴量)の中に0が繰り返し出現していることが報告されます。例えば、ある商品の売り上げが0の場合、その商品の需要がない可能性と、在庫がなかった可能性の両方が考えられます。このような、0が繰り返し出現する場合に疑われるトラブルを発見する手がかりとなります。

インライア」では、外れ値ではないものの、他の値と出現頻度が大きく異なり、望ましくない可能性がある値が報告されます。

外れ値」では、他の値から大きく外れた値が報告されます。

ただしこれらの報告はあくまでも「可能性」であり、必ずしも対処すべきものとは限りません。

datarobot-1_09.png

以上でデータの確認ができました。

次に、読み込んだデータを用いてモデリングを行います。

datarobot-1_10.png

今回は、手動モードで線形回帰モデルを作成するため、モデリングモードを「手動」に変更します。
DataRobotでは、モデルの作成においてさまざまモデリングモードが用意されています。

  • オートパイロット:完全自動モード
  • クイック :オートパイロットよりもモデル探索の過程を簡略化したモードで、オートパイロットよりも時間を短縮できる
  • 手動:リポジトリ(DataRobotのモデルのライブラリ)にある任意のモデルを実行するモード
  • 包括的オートパイロット:モデルの精度を高めるために、サンプルサイズを最大にして、可能性のある全てのモデルを作成するモード

datarobot-1_11.png

datarobot-1_12.png

datarobot-1_13.png

datarobot-1_14.png

今回は、線形回帰モデルを作成するので「Linear Regression」にチェックを入れます。

datarobot-1_15.png

datarobot-1_16.png

datarobot-1_17.png

以上でモデリングが完了しました。

次に、作成したモデルの性能を確認します。
datarobot-1_18.png

datarobot-1_19.png

datarobot-1_20.png

datarobot-1_21.png

datarobot-1_22.png

datarobot-1_23.png

以上でモデルの性能が確認できました。

4.まとめ

今回は、DataRobotの基本的な使い方についてご紹介しました。

通常、機械学習を行う際はPythonなどのプログラミング言語でコードを書いて実行するというプロセスが発生しますが、DataRobotではボタンをクリックするだけで簡単に機械学習を行うことができます。

機械学習をやってみたいけど周りにエンジニアやデータサイエンティストがいなくて困っている、という方はぜひ利用してみてはいかがでしょうか。

スキルアップAIでは、関連講座として「現場で使えるAIプランニング・プロジェクト推進基礎講座(DataRobot活用編)」を開講中です。 本講座では、AIプランニング・プロジェクト推進基礎講座で学ぶPoCフェーズにおいて、実際にDataRobotを活用してケースデータに対してPoCを実施することで、アイディエーションに留まらないプロジェクト推進のイメージを持てるように工夫しています。是非ご検討ください。

25卒向け!AIエンジニアになるための長期インターンプログラム参加者募集中!

25卒学生向けに、AIの基礎を学びながら就活も一括サポートする無料カリキュラムを提供しています。
修了するとE資格の受験資格も獲得できるプログラムとなっています!

長期インターン

特長①AIエンジニアやデータサイエンティストの基礎が身に付く
AIジェネラリスト基礎講座や機械学習のためのPython入門講座など、市場価値向上のための基礎を習得。

特長②AI・データ分析領域の優良求人を紹介
非公開求人や選考直結型インターンをご紹介し、早期内定の獲得をサポート。

特長③長期インターンプログラム専用の学生コミュニティ参加可
学生同士で就活情報をシェアしたり、学習を進めるうえでアドバイスをしあったりできるコミュニティに参加可能。

>>長期インターン詳細

☆☆☆
スキルアップAIのメールマガジンでは会社のお知らせや講座に関するお得な情報を配信しています。
配信を希望される方はこちら

また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
Twitterはこちら
Facebookはこちら
LinkedInはこちら
スキルアップAI公式YouTube AIビジネスチャンネルはこちら

3
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?