Teradata Vantage™ - Bring Your Own Model User Guide [リリース番号:3.0 最終更新日:2022/6/2]の内容をもとに作成しています。
Vantageアナリティクス BYOMシリーズのコンテンツです。
各機能の詳細な説明に関しては、段階的にリンクを追加していきますので、リンクから詳細ページを参照してご利用下さい。
モデル共有(BYOM)とは?
モデル共有(Bring Your Own Model)は、PythonやRといったオープンソースや、AutoMLといった分析ツールでモデリングを行い、それを予測モデル交換フォーマットにより、VantageCloudに取り込み、スコアリングする方法になります。
※BYOM=Bring Your Own Modelの略。
対応しているフォーマット
フォーマット | 説明 | 対応しているモデル |
---|---|---|
PMML | PMMLはXML ベースの予測モデル交換フォーマットです。 PMML は、分析アプリケーションが、データ マイニングおよび機械学習アルゴリズムによって生成された予測モデルを記述および交換する方法を提供します。 | 異常検出、クラスタリング、一般回帰、k 最近傍法、単純ベイズ、ニューロネットワーク、ランダムフォレスト、ディシジョン ツリー、ベクターマシン |
H2O.ai (MOJO) |
MOJOは、H2O の POJO に代わるものです。 POJO と同様に、H2O では、構築したモデルを MOJO に変換できます。MOJO は、リアルタイムでスコアリングのために展開できます。 | Driverless AIとH2O-3 MOJOモデルに対応しています。 |
ONNX | ONNX は、機械学習モデルを表現するために構築されたオープン フォーマットです。 ONNX は、AI 開発者がさまざまなフレームワーク、ツール、ランタイム、およびコンパイラでモデルを使用できるようにするための共通の演算子セット と共通のファイル形式を定義します。 | Chainer、Caffee2、PyTorch などはONNX へのネイティブ エクスポート機能をサポートしています。 Scikit-learn、TensorFlow、Keras、XGBoost、H2O、Spark ML などから ONNX に変換することもできます。 |
※H2O Driverless AI (DAI)の利用時には別途H2O DAIの各種ライセンスが必要となります。
モデル共有(BYOM)の利用手順
実行方法(PMMLの場合)
モデルテーブルの作成
CreateModelTable.sql
CREATE SET TABLE pmml_models
( model_id VARCHAR (30),
model BLOB )
PRIMARY INDEX (model_id);
モデルのロード(Teradata Studioからの場合)
ModelLoad.sql
INSERT INTO pmml_models VALUES ('iris_db_rf_model', ?);
スコアリングの実施
ExecuteScoring.sql
CREATE MULTISET TABLE glm_adult_binary AS /* スコアリング結果を格納するテーブルの作成 */
( SELECT * FROM mldb.PMMLPredict ( /* PMMLPredict関数の指定 */
ON adultTest /* データの入力テーブルの指定 */
ON (SELECT * FROM pmml_models WHERE model_id=‘adult_glm_b_model’) DIMENSION /* モデルの指定 */
USING
Accumulate (‘ID’) /* スコアリング結果の蓄積単位の指定 */
) AS TD
) WITH DATA;
おわりに
警告
この本書はWEB上で公開されておりますTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。