Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)
この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。
概要
リスケール変換を使用すると、データの最大値と最小値に基づく線形リスケーリング関数を使用して、連続した数値列のデータの上限と下限を制限することができます。リスケーリングは、ある範囲内のデータを必要とする、あるいはよりよく機能するアルゴリズムで有用です。
カラムの値を指定した下限値/上限値でスケールします。
[1,2,3]を0~1でスケールすると[0,0.5,1]になります。
前提条件
・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。
Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。
データの準備
サンプルデータの入手とデータベースへの格納方法
こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。
実行方法
SQLから実行する場合の例
lowerbound/最小値、upperbound/最大値を指定する。
CALL td_analyze (
'vartran', /* 分析手法 */
'
database = QID; /* データベース名 */
tablename = Superstore; /* テーブル名 */
rescale =
{rescalebounds (lowerbound/0, upperbound/1), columns (sales)}
{rescalebounds (lowerbound/0), columns (sales/sales2)}
{rescalebounds (upperbound/1), columns (sales/sales3)}
; /* 導出項目の定義 */
'
);
出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします
出力結果
データ量が多いため上位10件を表示しています。
Sales | sales2 | sales3 |
---|---|---|
0 | 0 | -22637.036 |
0.000004947425651235824 | 0.11200000000000004 | -22636.924 |
0.000017315989779325377 | 0.39199999999999996 | -22636.644 |
0.000018022764872359068 | 0.408 | -22636.628 |
0.000019082927511909604 | 0.432 | -22636.604 |
0.000020054743264830926 | 0.454 | -22636.582 |
0.000023853659389887002 | 0.54 | -22636.496 |
0.000024118700049774634 | 0.546 | -22636.489999999998 |
0.00002650406598876334 | 0.6000000000000001 | -22636.435999999998 |
0.00002809430994808914 | 0.6360000000000001 | -22636.399999999998 |
~ | ~ | ~ |
おわりに
サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。