Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)
この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。
概要
NULL変換を使用して、指定した列のNULL値をリテラル値、列の平均値、中央値、最頻値、または別のテーブルから結合した帰属値で置き換えることができます。列の値が偶数である場合、2 つの中間値の平均を取るか取らないかの中央値を要求することができます。
前提条件
・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。
Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。
データの準備
サンプルデータの入手とデータベースへの格納方法
こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。
実行方法
SQLから実行する場合の例
Sales,QuantityにNullが含まれている場合は0に置き換えます。
DiscountにNullが含まれている場合は平均値に置き換えます。
ProfitにNullが含まれている場合は最頻値に置き換えます。
CALL td_analyze (
'vartran', /* 分析手法 */
'
database = QID; /* データベース名 */
tablename = Superstore; /* テーブル名 */
keycolumns = Row_id; /* KEYカラム */
nullreplacement =
{nullstyle (literal, 0), columns (Sales,Quantity)}
{nullstyle (mean) , columns (Discount)}
{nullstyle (mode) , columns (Profit)}
; /* 導出項目の定義 */
'
);
オプションの説明
Nullスタイルパラメータ | 説明 |
---|---|
literal,{value} | valueはリテラル値を指定します |
mean | 平均値 |
median | 中央値 |
medianwithoutaveraging | 平均なしの中央値 |
mode | 最頻値 |
imputed,{tablename} | tablenameは入力データベースに存在し、null 置換を持つ各列に一致する列が含まれている必要があります。 |
出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします
出力結果
データ量が多いため上位10件を表示しています。
Sales | Quantity | Discount | Profit |
---|---|---|---|
73.164 | 6 | 0.8 | -186.5682 |
25.92 | 5 | 0.2 | 9.072 |
18.9 | 3 | 0 | 8.694 |
769.184 | 4 | 0.2 | -163.4516 |
15.552 | 3 | 0.2 | 5.4432 |
39.48 | 1 | 0 | 11.0544 |
399.98 | 2 | 0 | 171.9914 |
19.312 | 2 | 0.2 | 3.1382 |
209.792 | 2 | 0.2 | 26.224 |
9.648 | 6 | 0.8 | -16.884 |
~ | ~ | ~ | ~ |
おわりに
サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。