Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)
この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。
概要
再コード化変換を使用して、列の値を新しいコード体系で再表現したり、データ品質の問題を修正し、特定の値に分析を集中させることができます。個々の値、NULL 値、または残りの値を、新しい値、NULL 値、または同じ値にマップすることができます。
カラムの値を置換します。
前提条件
・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。
Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。
データの準備
サンプルデータの入手とデータベースへの格納方法
こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。
実行方法
SQLから実行する場合の例
Segmentの"Consumer"を"A"に置き換えます。以外は"good"に置き換えます。
Stateの"Alabama"を"A","Arizona"を"B","California"を"C"に置き換えます。以外はNullに置き換えます。
Regionの"Central"を"C","West"を"W"に置き換えます。以外は変換しない。
CALL td_analyze (
'vartran', /* 分析手法 */
'
database = QID; /* データベース名 */
tablename = Customer; /* テーブル名 */
recode =
{recodevalues (Consumer/A Rank), recodeother (good), columns (Segment)}
{recodevalues (Alabama/A,Arizona/B,California/C), recodeother (NULL), columns (State)}
{recodevalues (Central/C,West/W), recodeother (SAME), columns (Region)}
; /* 導出項目の定義 */
'
);
オプションの説明
置換パラメータ | 説明 |
---|---|
リテラル値 | リテラル値に置換します |
NULL | NULLに置換します |
SAME | 変換しない |
出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします
出力結果
データ量が多いため上位10件を表示しています。
Segment | State | Region |
---|---|---|
good | East | |
good | C | W |
ARank | C | W |
good | East | |
ARank | East | |
good | C | |
ARank | East | |
ARank | C | |
good | East | |
good | East | |
~ | ~ | ~ |
おわりに
サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。