Teradata Vantage - Vantage Analytics Library[2022/9/22時点]の翻訳です。
(リリース番号 : 2.1.1 | リリース日 : January 2022)
この記事はVantageアナリティクスライブラリ シリーズのコンテンツです。
概要
ビンコード変換を使用して、連続した数値列をカテゴリ列に置き換えることができます。ビンコード変換は、順序値(つまり、データ列のように順序が意味を持つ数値のカテゴリ値)を生成します。
前提条件
・Teradata Vantageインスタンスにアクセスできること。
・Vantage アナリティクス・ライブラリがインストールされていること。
Vantage アナリティクス・ライブラリのインストールについて、既にVantageを導入頂いているお客様はTeradataサポートサービスにお問い合わせください。
Vantage Express (評価版)やクラウドサービスのDIYでご利用頂く場合はTeradata Dounloadからダウンロードし利用可能です。
Vantage アナリティクス・ライブラリのインストール手順は「Vantageアナリティクス・ライブラリのインストール」の記事に従い行います。
データの準備
サンプルデータの入手とデータベースへの格納方法
こちらの「チュートリアル用のサンプルデータを用意する」を参照ください。
実行方法
SQLから実行する場合の例
call td_analyze (
'vartran', /* 分析手法 */
'
database = qid; /* データベース名 */
tablename = Superstore; /* テーブル名 */
bincode =
{binstyle (bins, 5), columns (quantity/q1)} /* ビンを5つ作成 */
{binstyle (binswithboundaries, 5, 3, 7), columns (quantity/q2)} /* 3~7の範囲でビンを5つ作成 */
{binstyle (boundaries, 3,5,7), columns (quantity/q3)} /* ~3,4~5,6~7,8~のビン */
{binstyle (quantiles, 5), columns (quantity/q4)} /* ビンの数を均等にビンを5つ作成 */
{binstyle (width, 3), columns (quantity/q5)} /* 幅3でビン作成 */
;
'
);
出力結果をテーブルに書き込む場合は以下オプションを指定可能です。
outputdatabase = 出力データベース名;
outputtablename = 出力テーブル名;
overwrite = {true | false}; --- 未指定の場合はtrueで上書きします
オプションの説明
オプション | 説明 |
---|---|
bins | 指定された数(n)を持つビンを作成 ビンの幅を均等にする |
binswithboundaries | 指定された数(n)を持つビンを作成 ビンを作成する範囲を指定 ビンの幅を均等にする 範囲以下は0ビン、範囲以上はn+1ビンで作成 |
boundaries | 境界線を指定してビンを作成 |
quantiles | 指定された数(n)を持つビンを作成 ビンの数を均等にする |
width | 指定された幅のビンを作成 |
出力結果
初めの10件のみ表示しています。
結果の数値はビン番号です。
q1 | q2 | q3 | q4 | q5 |
---|---|---|---|---|
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 |
~ | ~ | ~ | ~ | ~ |
おわりに
サンプルコードはSQL関数から掲載し順次Pythonコードも掲載していく予定です。
警告
この本書はTeradata Vantageドキュメンテーションよりトピックに必要な情報を抜粋したものです。掲載内容の正確性・完全性・信頼性・最新性を保証するものではございません。正確な内容については、原本をご参照下さい。
また、修正が必要な箇所や、ご要望についてはコメントをよろしくお願いします。