はじめに
読者の皆様はExcelで大量のデータ集計をする場合、
以下の点に悩まされた事はありませんか?
・ファイルサイズ
・データソース間のデータ収集、および結合
・処理のエラーハンドリング
・データ更新タイミングでの再集計
・集計結果の外部ツール連携
データソースの種類が多岐に渡ることで集計処理に時間が掛かるという課題を抱えている方は多いようです。
こういったケースの場合、
Alteryx Designer に置き換える事で作業の効率化・省力化を図る事が可能になります。
この記事では、
フィルターツールについて勉強していきます。
フィルターツール
「フィルター」ツールは、以下のいずれかの方法でワークフローに追加が可能となっています。
・ツール一覧から準備カテゴリにあるフィルターツールを選択し、キャンバスにドラッグする。
・右上の検索画面にて"filter"と入力し、フィルターツールを選択する。
この「フィルター」ツールは、以下の用途にて使用するツールになります。
・入力した値を使用しての行選択
・日付/時刻データを使用しての行選択
・欠落データの有無による行選択
・複合条件を使用しての行選択
それでは、設定についてみていきましょう。
ツールの設定
フィルターツールでは、「基本フィルター」または、「カスタムフィルター」が選択できます。
・基本フィルター:単一の列に対して単純な条件を作成可能
・カスタムフィルター:複数の列を使用して複雑な条件を作成可能
基本フィルター
- 列を選択 ドロップダウンで、フィルタリングするデータ列を選択します。
- 演算子を選択します。
※使用できる演算子は、フィルタリングに使用する列のデータ型によって異なります。 - 条件を完了するための値を入力します。
基本フィルターの演算子
使用できる演算子は、フィルタリングする列のデータ型によって異なります。詳しくは、下記の使用可能なデータ型を参照してください。
演算子 | 説明 | 使用可能なデータ型 |
---|---|---|
= | 値が入力に一致する。 | 数値、日付、日付/時刻 |
等しい | 値が入力に一致する。 | 文字列 |
!= | 値が入力に一致しない。 | 数値、日付、日付/時刻 |
等しくない | 値が入力に一致しない。 | 文字列 |
> | 値が入力より大きい。 | 数値、日付、日付/時刻 |
>= | 値が入力より大きいか等しい。 | 数値、日付、日付/時刻 |
< | 値が入力より小さい。 | 数値、日付、日付/時刻 |
<= | 値が入力より小さいか等しい。 | 数値、日付、日付/時刻 |
Null である | 値が無いか不明な値である | 数値、日付、日付/時刻、時刻、文字列、空間、ブール |
Null ではない | 値が存在するまたは不明な値ではない | 数値、日付、日付/時刻、時刻、文字列、空間、ブール |
より前 (<) | 値が入力の前に来るようにソート | 文字列 |
より後ろ (>) | 値が入力の後に来るようにソート | 文字列 |
含まれる | 値が文字列のどこかに含まれている | 文字列 |
含まれない | 値が文字列のどこにもない (大文字と小文字を区別) | 文字列 |
空である | 値が Null または "" である | 文字列 |
空ではない | 値が Null でも "" でもない | 文字列 |
範囲 | 値は選択された開始日と終了日である | 日付、日付/時刻 |
開始日以降の期間 | 値が選択された最初の日およびその後の期間を示す数である | 日付、日付/時刻 |
終了日以前の期間 | 値が選択された最後の日およびその前の期間を示す数である | 日付、日付/時刻 |
True(真)である | 値がTrueである | ブール値 |
False(偽)である | 値がTrueではない | ブール値 |
カスタムフィルター
カスタムフィルターで条件を指定する場合、式エディターに構文を入力する必要があります。※条件の構築に役立つ機能も多数あり、下記の式エディターのヒントを参照してみてください。
式エディターのヒントについて
式エディター内で関数をサポート機能(ヒント)が使用できます。
・Ctrlキーを押しながらSpaceキーを押すと、すべての関数の一覧が表示されます。
・キーワードまたはフレーズを入力すると、対象の関数の一覧が表示されます。
・式で使用する変数のリストを表示するには、「[ 」 ( 左角括弧) を入力します。
・「fx」アイコンを選択して、関数を参照および検索が可能です。
・「x」アイコンを選択して、列と定数を参照または検索が可能です。
・「フォルダー」アイコンを選択して、最近の式と保存された式を参照または検索が可能です。
式の保存について
カスタムフィルターでは、
作成した式を保存することで、同じ式を別のフィルターツールでも呼び出すことができます。
ワークフロー作成(イメージ)
実際にAlteryx Designer上で対象ツールを使用したワークフローを作成していきたいと思います。
①配置
準備カテゴリからフィルターツールを選択し、キャンバスエリアにドラッグし配置します。②設定
■ 入力した値を使用しての行選択 単純にデータを入力した値と比較して行を絞り込む場合、基本フィルターで設定ができます。
上記の条件では、「都道府県」の値が"東京"と一致するデータがTアンカーに出力されます。
※"東京"以外のデータについては、Fアンカーに出力されます。
■ 日付/時刻データを使用しての行選択
単純な日付を条件とする場合、基本フィルターで設定ができます。
今回は、ワークフロー実行日(Today)より過去のデータに絞り込む場合を例としています。
追加情報
特定の期間内のデータに絞り込みをする場合、カスタムフィルターでの指定が必要となります。
■ 欠落データの有無による行選択
欠落データの有無を条件とする場合、基本フィルターで設定ができます。
■ 複合条件を使用しての行選択
複数の条件をしているする場合、カスタムフィルターで設定します。
③実行
「実行」ボタンを押下することで作成したワークフローが実行され、
ツールに設定した内容で出力されていることを結果ウィンドウにて確認できます。
おわりに
ここでは、Alteryxフィルターツールの基本的な使い方と設定方法について説明しました。
今回の内容は以下のタグでツール毎に紹介していますので、よければ他のツールについてもご参照いただければ幸いです。
仲間募集
NTTデータ テクノロジーコンサルティング事業本部 では、以下の職種を募集しています。1. クラウド技術を活用したデータ分析プラットフォームの開発・構築(ITアーキテクト/クラウドエンジニア)
クラウド/プラットフォーム技術の知見に基づき、DWH、BI、ETL領域におけるソリューション開発を推進します。https://enterprise-aiiot.nttdata.com/recruitment/career_sp/cloud_engineer
2. データサイエンス領域(データサイエンティスト/データアナリスト)
データ活用/情報処理/AI/BI/統計学などの情報科学を活用し、よりデータサイエンスの観点から、データ分析プロジェクトのリーダーとしてお客様のDX/デジタルサクセスを推進します。https://enterprise-aiiot.nttdata.com/recruitment/career_sp/datascientist
3.お客様のAI活用の成功を推進するAIサクセスマネージャー
DataRobotをはじめとしたAIソリューションやサービスを使って、 お客様のAIプロジェクトを成功させ、ビジネス価値を創出するための活動を実施し、 お客様内でのAI活用を拡大、NTTデータが提供するAIソリューションの利用継続を推進していただく人材を募集しています。4.DX/デジタルサクセスを推進するデータサイエンティスト《管理職/管理職候補》
データ分析プロジェクトのリーダとして、正確な課題の把握、適切な評価指標の設定、分析計画策定や適切な分析手法や技術の評価・選定といったデータ活用の具現化、高度化を行い分析結果の見える化・お客様の納得感醸成を行うことで、ビジネス成果・価値を出すアクションへとつなげることができるデータサイエンティスト人材を募集しています。ソリューション紹介
Trusted Data Foundationについて
~データ資産を分析活用するための環境をオールインワンで提供するソリューション~https://enterprise-aiiot.nttdata.com/tdf/
最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。
TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について
~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~https://enterprise-aiiot.nttdata.com/service/tdf/tdf_am
TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。
NTTデータとTableauについて
ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。
NTTデータとAlteryxについて
Alteryxは、業務ユーザーからIT部門まで誰でも使えるセルフサービス分析プラットフォームです。 Alteryx導入の豊富な実績を持つNTTデータは、最高位にあたるAlteryx Premiumパートナーとしてお客さまをご支援します。導入時のプロフェッショナル支援など独自メニューを整備し、特定の業種によらない多くのお客さまに、Alteryxを活用したサービスの強化・拡充を提供します。
NTTデータとDataRobotについて
DataRobotは、包括的なAIライフサイクルプラットフォームです。 NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。NTTデータとInformaticaについて
データ連携や処理方式を専門領域として10年以上取り組んできたプロ集団であるNTTデータは、データマネジメント領域でグローバルでの高い評価を得ているInformatica社とパートナーシップを結び、サービス強化を推進しています。NTTデータとSnowflakeについて
NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。 NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。 Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。タグ:Alteryx