Teradata Vantage - 分析機能 [2022/10/06時点]の翻訳です。
VantageはSQLにおける分析だけでなく、マシンラーニングや、タイムシリーズ、地理空間分析など高度な分析を実現できます。本シリーズでは、Vantageの持つ、高度な分析機能についての情報を掲載していきます。
各機能の詳細な説明に関しては、段階的にリンクを追加していきますので、リンクから詳細ページを参照してご利用下さい。
ClearScape Analyticsとは?
ClearScape Analyticsは、VantageCloudにおける分析機能として、幅広い用途でご利用いただけます。
ClearScape Analyticsの機能概要
ClearScape Analyticは、VantageCloudのアナリティクスに関する機能群です。
ClearScape Analyticは、データベースに対する拡張関数及びストアドプロシージャによるインデータベース分析、オープンソースによる分析、分析ツールと統合された分析、複数の言語もしくはAPIからのアクセス、ModelOpsによる分析モデルのライフサイクルの管理など、多くの分析に関する機能を持っています。
インデータベース分析機能の一覧
イン・データベース分析は現在4つの方法にてご利用いただけます。分析する目的に応じて使い分けができます。
フレームワーク | 機能概要 |
---|---|
マシンラーニング関数 (SQL MapReduce フレームワーク) |
データ準備、探索、特徴抽出、モデル作成、スコアリングといったマシンラーニングを実現るための100種類以上の関数が用意されれイン・データベースによる分析で高速な性能でマシンラーニングを実行することができます。 |
タイムシリーズ関数 (無制限配列 フレームワーク) |
無制限の配列フレームワークの上で動作し、分析ライフサイクル全体をカバーする50以上の新しい高度な分析機能。特定の分析問題(テキスト、分類、回帰、時系列など)をサポートするためにパイプラインに配置されます |
Vantage アナリティクス・ ライブラリ |
データ変換、記述統計、仮説検定、クラスタリング、回帰、予測アルゴリズムなど、高度な関数の豊富なライブラリをJAVA外部プロシージャとして実装したもので、R、Python、SQLから使用することができます。 |
4Dアナリティクス | 地理空間分析(3D)に加えて、タイムシリーズ及びテンポラルといった時間軸(1D)に関する分析を組み合わせて実現することで、地理空有間(3D)+時間軸(1D)=4Dの分析を実現できます。 |
オープンソース連携(Bring Your Own Analytics)
オープンソース連携(Bring Your Own Analytics)では、PythonやRといったオープンソースでの分析をVantageCloudと連携して稼働させることで、スケールした分析を実現します。
モデル共有(Bring Your Own Model)
モデル共有(Bring Your Own Model)は、PythonやRといったオープンソースや、AutoMLといった分析ツールでモデリングを行い、それを予測モデル交換フォーマットにより、VantageCloudに取り込み、スコアリングする方法になります。
オープン・アナリティクス・フレームワーク
- カスタムまたはオープンソースのR / Pythonコードおよび標準のライブラリを使用出来ます。
- 並列計算による R/Python コードを実行します。
- クラウド・ネイティブなアーキテクチャにより、オート・スケーリングにより最適なパフォーマンスを実現します。
スクリプトのDB実行 (STO - Script Table Operator)
スクリプトのDB実行 は Python または R コードのブロックを「データベース内」で実行します。
PythonやRをデータベースで実行するため、クライアント側にデータを移動する必要がなく、並列で処理を行うことができるため、分析作業の効率化します。
Python and R 用のライブラリ
teradataml(VantageのPython用パッケージ)とtdplyr(VantageのPython用パッケージ)はTeradata ダウンロード サイトからはダウンロードして使用することができます。
言語 | 説明 |
---|---|
Python (teradataml) |
PythonからVantageにアクセスしてして、関数を使用してデータの読み込み、格納、加工、分析などを実施できます。 |
R (Tdyplyer) |
R言語からVantageにアクセスしてして、関数を使用してデータの読み込み、格納、加工、分析などを実施できます。 |
JupyterLab Teradata拡張モジュール
JupyterLab Teradata拡張モジュールは、Jupyterに対して、SQLカーネルと、Teradata Vantageのための拡張機能を提供します。
分析ツールとの統合
様々なアナリティクス・ツールと連携して利用することで、アナリティクス・ツールのもつ機能性や操作性と、Vantageの高速性能を組み合わせてることで、多様な分析を実現します。
分析ツール名 | 説明 |
---|---|
Dataiku | Dataikuはデータ準備、機械学習、AIOpsなど多くの機能を揃えた分析なプラットフォームです。Teradata Vantageとの接続して動作するためのプラグインを提供しており、またモデル共有(BYOM)により、Dataikuで作成したモデルをインデータベースでスコアリングする方法で連携してご利用いただくことができます。 |
H2O.ai | H2O.ai は、あらゆる環境での AI による作成、運用、革新を簡素化および加速するように設計された高度な AI クラウド プラットフォームです。Teradata Vantageはオープンソース版、商用版と連携して動作します。モデル共有(BYOM)により、H2O.aiで作成したモデルをインデータベースでスコアリングする方法で連携してご利用いただくことができます。 |
KNIME | KNIME(KNIME Analytics Platform)はワークフロー型データ分析プラットフォームを提供する無償のオープンソースソフトウェアです。データの前処理や機械学習を活用したワークフローをノーコードで構築でき、様々な業務でご活用できます。 |
Amazon SageMaker | Amazon SageMakerはAWS環境でのクラウド機械学習プラットフォームです。 開発者はクラウドで機械学習モデルを作成、トレーニング、デプロイできます。Teradata VantageとはAPIによる連携と、モデル共有(BYOM)による連携を行うことができます。 |
Azure Machine Learning | Azure Machine Learning は、Azure環境にて機械学習プロジェクトのライフサイクルを加速および管理するためのクラウド サービスです。Teradata VantageとはAPIによる連携と、モデル共有(BYOM)による連携を行うことができます。 |
Vertex AI | Google が提供するマネージドな機械学習のプラットフォームで、機械学習 API の利用はもちろん、 AutoML トレーニングとカスタムトレーニングの両方でモデルの保存、モデルのデプロイ、予測のリクエストなどを行うことができます。 |
Python | Pythonはデータサイエンスで広く利用されている汎用のプログラミング言語です。teradatamlライブラリを用いることで、Teradata Vantageのインデータベースで、データ準備や分析関数を用いた機械学習などの分析を行うことができる上で、モデル共有(BYOM)による連携も行うことができます。 |
R | Rは統計解析やグラフィックスの分野で広く利用される言語です。tdplyrライブラリを用いることで、Teradata Vantageのインデータベースで、データ準備や分析関数を用いた機械学習などの分析を行うことができる上で、モデル共有(BYOM)による連携も行うことができます。 |
クラウド分析ツールとのAPI連携
Vantage ModelOps
ModelOpsは分析モデルのバージョン管理、デプロイ、パフォーマンスのモニタリングなど分析モデルにおけるライフサイクルを管理するためのソフトウェアです。
おわりに
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。