8
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)

この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。

概要

NULL変換を使用して、指定した列のNULL値をリテラル値、列の平均値、中央値、最頻値、または別のテーブルから結合した帰属値で置き換えることができます。列の値が偶数である場合、2 つの中間値の平均を取るか取らないかの中央値を要求することができます。

前提条件

・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。

Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。

データの準備

サンプルデータの入手とデータベースへの格納方法

こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。

実行方法

SQLから実行する場合の例

Sales,QuantityにNullが含まれている場合は0に置き換えます。
DiscountにNullが含まれている場合は平均値に置き換えます。
ProfitにNullが含まれている場合は最頻値に置き換えます。

CALL td_analyze (
  'vartran',                          /* 分析手法 */
  '
  database        = QID;              /* データベース名 */
  tablename       = Superstore;       /* テーブル名 */
  keycolumns      = Row_id;           /* KEYカラム */
  nullreplacement =
     {nullstyle (literal, 0), columns (Sales,Quantity)}
     {nullstyle (mean)      , columns (Discount)}
     {nullstyle (mode)      , columns (Profit)}
  ;                                   /* 導出項目の定義 */
  '
);

オプションの説明

Nullスタイルパラメータ 説明
literal,{value} valueはリテラル値を指定します
mean 平均値
median 中央値
medianwithoutaveraging 平均なしの中央値
mode 最頻値
imputed,{tablename} tablenameは入力データベースに存在し、null 置換を持つ各列に一致する列が含まれている必要があります。

出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします

出力結果

データ量が多いため上位10件を表示しています。

Sales Quantity Discount Profit
73.164 6 0.8 -186.5682
25.92 5 0.2 9.072
18.9 3 0 8.694
769.184 4 0.2 -163.4516
15.552 3 0.2 5.4432
39.48 1 0 11.0544
399.98 2 0 171.9914
19.312 2 0.2 3.1382
209.792 2 0.2 26.224
9.648 6 0.8 -16.884

おわりに

サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。

警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。

Teradata Vantageへのお問合せ

Teradata Vantage へのお問合せ

8
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?