1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【初級編】Alteryx結合ツールの基本的な使い方や設定方法についてわかりやすく解説してみた

Posted at

はじめに

読者の皆様はExcelで大量のデータ集計をする場合、
以下の点に悩まされた事はありませんか?

・ファイルサイズ
・データソース間のデータ収集、および結合
・処理のエラーハンドリング
・データ更新タイミングでの再集計
・集計結果の外部ツール連携

データソースの種類が多岐に渡ることで集計処理に時間が掛かるという課題を抱えている方は多いようです。

こういったケースの場合、
Alteryx Designer に置き換える事で作業の効率化・省力化を図る事が可能になります。

この記事では、
結合ツールについて勉強していきます。

結合ツール

image.png
この「結合」ツールは、2つのテーブル情報を結合する際に使用するツールになり、
以下のいずれかの方法でワークフローに追加が可能となっています。

・ツール一覧から結合カテゴリにある結合ツールを選択し、キャンバスにドラッグする。
・右上の検索画面にて"join"と入力し、結合ツールを選択する。

ツールコンポーネント

image.png

フィルターツールには5つのアンカーがあります。
 ■ 入力アンカー
・Lアンカー:結合する対象データ
・Rアンカー:結合する対象データ
 ■ 出力アンカー
・Lアンカー:結合条件に一致しない入力アンカー「L」のデータが出力される
・Jアンカー:結合条件に一致するデータが出力される
・Rアンカー:結合条件に一致しない入力アンカー「R」のデータが出力される

また、結合結果に対して以下の処理を行えるようになっています。

・項目の除外
・項目の並び替え
・項目の説明追加
・項目の名称変更
・データ型変更
・データサイズ変更

それでは、設定についてみていきましょう。

ツールの設定

結合方法については、2つの方法があります。
その時々の条件に合うように指定していきましょう。
image.png
・レコードの位置による結合:2テーブル内の項目位置によって結合
・特定のフィールドで結合 :2テーブル内の同一項目を指定し結合
 

注意事項

■ 数値の丸めについて
 数値項目(Double、Floatなど)については、
 桁数により"丸め"がされることがあるため、結合条件とすることは推奨されていません。

■ 結合条件の指定により発生するエラーメッセージについて
 結合条件として指定する項目については、データ型が一致している必要があります。
 不一致の場合、以下のようなエラーメッセージが表示されるため、注意ください。

 ・文字列フィールドは他の文字列フィールドにのみ結合できます。
 ・数値フィールドは他の数値フィールドにのみ結合できます。
 ・ブールフィールドは、他のブールフィールドにのみ結合できます。
 ・日付/時刻フィールドは、その正確なデータ型にのみ結合できます。
 ・空間フィールドは結合できません。代わりに 空間マッチツール を使用してください。
 ・Blob フィールドは、他のタイプに結合することはできません。


項目の除外

データ内に集計や分析には使用しない項目がある場合、その項目を除外することが可能です。

項目を除外することで、
ワークフロー処理で使用するデータが制限され、パフォーマンスが向上する可能性があります。

■ 設定
データ項目の一覧の先頭に表示されているチェックマークを外してください。

追加情報
結合ツールでは、取り込んだデータ項目以外に“*Unknown”という項目が表示されます。
image.png

この項目は、
ワークフローの運用後、取り込み対象のファイルにデータ項目が増えた場合、
増えた項目も取り込み対象とすることができるようにする便利な項目となります。

データ項目がワークフロー作成時以降も変更する予定がない、
または、不要なデータ項目が取り込まれることを回避したい場合は、
こちらの“*Unknown”という項目のチェックを外すことで、
結合ツール以降の処理対象から外すことが可能となります。


項目の並び替え

データの項目を並べ替えることができます。

■ 設定
対象の項目を選択し、上部に表示されている上下の矢印をクリックして表示順を変更します。


項目の説明追加

データの項目に説明を追加することができ、
ワークフロー作成者以外にもその項目の用途が確認できるようになります。

■ 設定
対象の項目の説明欄をクリックし入力します。


項目名称変更

データの項目名称を変更することができます。

■ 設定
対象の項目の名前の変更欄をクリックし入力します。


データ型変更

データの型を変更することができます。

■ 設定
対象の項目のデータ型欄のドロップダウンメニューから変更します。


データサイズ変更

データのサイズ(桁数)を変更することができます。

■ 設定
対象の項目のサイズ欄をクリックし入力します。

ワークフロー作成(イメージ)

実際にAlteryx Designer上で対象ツールを使用したワークフローを作成していきたいと思います。

①配置
結合カテゴリから結合ツールを選択し、キャンバスエリアにドラッグし配置します。

image.png

②設定
結合ツールの設定をします。
※設定方法については、前段の「ツール設定」を参照

image.png

③実行
「実行」ボタンを押下することで作成したワークフローが実行され、
ツールに設定した内容で出力されていることを結果ウィンドウにて確認できます。

image.png

追加情報
ツールのアンカーを選択することで、実行前後でのデータの状況を確認することができます。

image.png

■ 入力
  L / Rアンカー選択時:それぞれのinputデータを確認できる
■ 出力
 ・Lアンカー選択時:
  入力のLアンカーだけに存在するデータを確認できる
 ・Jアンカー選択時:
  条件に一致するデータ(結合したデータ)を確認できる
 ・Rアンカー選択時:
  入力のRアンカーだけに存在するデータを確認できる


例)
東日本の都道府県別売上データ(下記、入力のLアンカー)と
都道府県別の地方名称データ(下記、入力のRアンカー)を項目:都道府県で結合してみました。
※条件の設定内容については、上記「②設定」を参照

■ 入力
 ・Lアンカー(東日本のみ)
 
 ・Rアンカー(47都道府県データ)
 

■ 出力
 ・Lアンカー
 
 都道府県がNullとなっている売上データ(入力のLアンカーだけに存在する)が確認できます。

 ・Jアンカー
 
 東日本の都道府県別売上+地方名称データが確認できます。

 ・Rアンカー
 
 西日本の地方名称データ(入力のRアンカーにだけ存在する)が確認できます。

おわりに

ここでは、データソースからのデータ収集をAlteryx Designer ではどのように設定するかについて説明しました。

今回の内容は以下のタグでツール毎に紹介していますので、よければ他のツールについてもご参照いただければ幸いです。

仲間募集

NTTデータ テクノロジーコンサルティング事業本部 では、以下の職種を募集しています。
1. クラウド技術を活用したデータ分析プラットフォームの開発・構築(ITアーキテクト/クラウドエンジニア) クラウド/プラットフォーム技術の知見に基づき、DWH、BI、ETL領域におけるソリューション開発を推進します。
https://enterprise-aiiot.nttdata.com/recruitment/career_sp/cloud_engineer
2. データサイエンス領域(データサイエンティスト/データアナリスト) データ活用/情報処理/AI/BI/統計学などの情報科学を活用し、よりデータサイエンスの観点から、データ分析プロジェクトのリーダーとしてお客様のDX/デジタルサクセスを推進します。

https://enterprise-aiiot.nttdata.com/recruitment/career_sp/datascientist

3.お客様のAI活用の成功を推進するAIサクセスマネージャー DataRobotをはじめとしたAIソリューションやサービスを使って、 お客様のAIプロジェクトを成功させ、ビジネス価値を創出するための活動を実施し、 お客様内でのAI活用を拡大、NTTデータが提供するAIソリューションの利用継続を推進していただく人材を募集しています。

https://nttdata.jposting.net/u/job.phtml?job_code=804

4.DX/デジタルサクセスを推進するデータサイエンティスト《管理職/管理職候補》 データ分析プロジェクトのリーダとして、正確な課題の把握、適切な評価指標の設定、分析計画策定や適切な分析手法や技術の評価・選定といったデータ活用の具現化、高度化を行い分析結果の見える化・お客様の納得感醸成を行うことで、ビジネス成果・価値を出すアクションへとつなげることができるデータサイエンティスト人材を募集しています。

https://nttdata.jposting.net/u/job.phtml?job_code=898

ソリューション紹介

Trusted Data Foundationについて ~データ資産を分析活用するための環境をオールインワンで提供するソリューション~

https://enterprise-aiiot.nttdata.com/tdf/

最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。

TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について ~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~

https://enterprise-aiiot.nttdata.com/service/tdf/tdf_am

TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。

NTTデータとTableauについて ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。

これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。

https://enterprise-aiiot.nttdata.com/service/tableau

NTTデータとAlteryxについて Alteryxは、業務ユーザーからIT部門まで誰でも使えるセルフサービス分析プラットフォームです。 Alteryx導入の豊富な実績を持つNTTデータは、最高位にあたるAlteryx Premiumパートナーとしてお客さまをご支援します。

導入時のプロフェッショナル支援など独自メニューを整備し、特定の業種によらない多くのお客さまに、Alteryxを活用したサービスの強化・拡充を提供します。

https://enterprise-aiiot.nttdata.com/service/alteryx

NTTデータとDataRobotについて DataRobotは、包括的なAIライフサイクルプラットフォームです。 NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。

https://enterprise-aiiot.nttdata.com/service/datarobot

NTTデータとInformaticaについて データ連携や処理方式を専門領域として10年以上取り組んできたプロ集団であるNTTデータは、データマネジメント領域でグローバルでの高い評価を得ているInformatica社とパートナーシップを結び、サービス強化を推進しています。

https://enterprise-aiiot.nttdata.com/service/informatica

NTTデータとSnowflakeについて NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。 NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。 Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。

https://enterprise-aiiot.nttdata.com/service/snowflake

タグ:Alteryx

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?