Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)
この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。
概要
値分析はアナリストがデータの性質や品質を判断するために役立ちます。
データの合計行数、データのユニーク性、ゼロや空白、Nullを含む、正数または負数などを把握する事が出来ます。
前提条件
・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。
Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。
データの準備
サンプルデータの入手とデータベースへの格納方法
こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。
実行方法
SQLから実行する場合の例
CALL td_analyze (
'values', /* 分析手法 */
'
database = QID; /* データベース名 */
tablename = Superstore; /* テーブル名 */
columns = Row_ID,Ship_Date,Customer_Name,Profit; /* カラムリスト */
'
);
出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします
出力結果
xdb | xtbl | xcol | xtype | xcnt | xnull | xunique | xblank | xzero | xpos | xneg |
---|---|---|---|---|---|---|---|---|---|---|
QID | Superstore | Row_ID | INTEGER | 9994 | 0 | 9994 | 0 | 9994 | 0 | |
QID | Superstore | Ship_Date | VARCHAR(128) CHARACTER SET UNICODE | 9994 | 0 | 1334 | 0 | |||
QID | Superstore | Customer_Name | VARCHAR(128) CHARACTER SET UNICODE | 9994 | 0 | 793 | 0 | |||
QID | Superstore | Profit | FLOAT | 9994 | 0 | 7287 | 65 | 8058 | 1871 |
出力結果の説明
カラム名 | データタイプ | 説明 |
---|---|---|
xdb | VARCHAR (128) | データベース名 |
xtbl | VARCHAR (128) | テーブル名 |
xcol | VARCHAR (128) | カラム名 |
xtype | VARCHAR (128) | データタイプ |
xcnt | FLOAT | レコード数 |
xnull | FLOAT | 値がNULLの数 |
xunique | FLOAT | 値のユニーク数 |
xblank | FLOAT | 値が空白の数 |
xzero | FLOAT | 値が0の数 |
xpos | FLOAT | 値が正の値の数 |
xneg | FLOAT | 値が負の値の数 |
おわりに
サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。