はじめに
読者の皆様はExcelで大量のデータ集計をする場合、
以下の点に悩まされた事はありませんか?
・ファイルサイズ
・データソース間のデータ収集、および結合
・処理のエラーハンドリング
・データ更新タイミングでの再集計
・集計結果の外部ツール連携
データソースの種類が多岐に渡ることで集計処理に時間が掛かるという課題を抱えている方は多いようです。
こういったケースの場合、
Alteryx Designer に置き換える事で作業の効率化・省力化を図る事が可能になります。
この記事では、
検索置換ツールについて勉強していきます。
検索置換ツール
この「検索置換」ツールは、1 つの項目値を指定値に置き換えることが可能となっています。
これは、Excelのvlookup関数に該当する機能となっており、検索結果を新たな列として追加するときにも使用できます。
このツールについては、以下のいずれかの方法でワークフローに追加が可能となっています。
・ツール一覧から結合カテゴリにある検索置換ツールを選択し、キャンバスにドラッグする。
・右上の検索画面にて"find"と入力し、検索置換ツールを選択する。
それでは、設定についてみていきましょう。
ツールの設定
この検索置換ツールは、「検索」と「置換」という2つのセクションで構成されています。
セクション:検索
検索対象項目と検索条件を指定するセクションとなっています。
■ 検索対象項目
どの項目を使用して検索を行うのかを設定する必要があります。
・検索対象のフィールド:
検索対象となるFアンカーの項目を選択します。
・検索する値:
「検索対象のフィールド」と同じ値が格納されているRアンカーの項目を選択します。
vlookup関数との類似性①
上記で記載した検索対象項目の設定は、vlookup関数の下記に該当します。
■Excel:vlookup関数
=vlookup(検索値,範囲,列番号,検索方法)
・検索値:(Fアンカーの項目)検索対象のフィールド
・範囲 :(Rアンカーの項目)検索する値
■ 検索条件
このツールでは、「検索する値」がどのように含まれているか細かい設定が可能です。
・フィールドの先頭:
「検索する値」で設定した項目値が先頭に存在するものを対象とする
・フィールドの任意の部分:
「検索する値」で設定した項目値が任意の部分(どこでも可)に存在するものを対象とする
・フィールド全体:
「検索する値」で設定した項目値が完全に一致するものを対象とする
・検索時に大文字と小文字を区別しない:
検索文字の大文字と小文字を区別しなくなります。
・単語全体一致のみ:
先頭と末尾にスペースがある箇所を単体の文字列として認識し、
その部分のみを検索対象として使用できるようになります。
vlookup関数との類似性②
上記で記載した検索対象項目の設定は、vlookup関数の下記に該当します。
■Excel:vlookup関数
=vlookup(検索値, 範囲,列番号,検索方法)
vlookup関数では、検索方法は"近似一致"か"完全一致"しか指定できないのに対し、
検索置換ツールの方が、より詳細な設定が可能となっていることが分かります。
セクション:置換
検索した結果を対象で置換する項目の追加をするか指定するセクションとなっています。
・見つかったテキストを次のフィールドの値に置換
「検索対象のフィールド」の値を置換する場合に選択します。
この場合、
プルダウンで選択したRアンカーの項目の値を使用して、対象項目の値が置換されます。
・フィールドをレコードに追加
R入力アンカーの対象項目を列として追加する場合に選択します。
この場合、
検索対象が存在するレコードにのみ、Rアンカーの項目の値が追加された列に設定されます。
※検索結果として該当なしとなったレコードについては、Nullが設定される。
vlookup関数との類似性③
上記で記載した検索対象項目の設定は、vlookup関数の下記に該当します。
■Excel:vlookup関数
=vlookup(検索値, 範囲,列番号,検索方法)
vlookup関数では、列の追加のみなのに対し
検索置換ツールは置換も行えるため、項目を増やさず集計の粒度の変更が可能となります。
結合ツールとの違いについて
検索置換ツールでは、列を追加すると言う結合ツールと同様の機能があります。
そのため、どのような違いがあるかについてまとめていきます。
まずは、結合条件の指定についてです。
概要 | 結合ツール | 検索置換ツール |
---|---|---|
条件指定(項目) | 複数項目の指定可能 | 単一項目のみ指定可能 |
条件指定(方法) | 完全一致のみ | 部分一致も可能 |
結合ツールでは、
条件として指定できる項目は複数選択することはできますが、
そのすべてが完全に一致する場合しか列の追加(結合)はされません。
検索置換ツールでは、
逆に条件として指定できる項目は単一の項目しか選択することはできますが、
部分一致と言った特殊なケースの場合でもレコードの列の追加(結合)が行えます。
次に、結合の結果についてです。
ここでは、Rアンカーに該当レコードが複数ある場合を記載します。
概要 | 結合ツール | 検索置換ツール |
---|---|---|
結合の結果(単一) | 正常に列が追加される | 正常に列が追加される |
結合の結果(複数) | 重複した分レコードが増える | 最終レコード情報のみ設定される |
結合の結果(なし) | 結合されない | Nullが設定される |
結合の結果が単一となる場合、どちらのツールでも結果は変わりありませんが、
それ以外の場合は、結果に違いが出てきます。
これらの違いは、使用目的によって影響が出る可能性がありますので注意してください。
ワークフロー作成(イメージ)
実際にAlteryx Designer上で対象ツールを使用したワークフローを作成していきたいと思います。
①配置
結合カテゴリから検索置換ツールを選択し、キャンバスエリアにドラッグし配置します。②設定
検索置換ツールの設定をします。※設定方法については、前段の「ツール設定」を参照
③実行
「実行」ボタンを押下することで作成したワークフローが実行され、ツールに設定した内容で出力されていることを結果ウィンドウにて確認できます。
おわりに
ここでは、データソースからのデータ収集をAlteryx Designer ではどのように設定するかについて説明しました。
今回の内容は以下のタグでツール毎に紹介していますので、よければ他のツールについてもご参照いただければ幸いです。
仲間募集
NTTデータ テクノロジーコンサルティング事業本部 では、以下の職種を募集しています。1. クラウド技術を活用したデータ分析プラットフォームの開発・構築(ITアーキテクト/クラウドエンジニア)
クラウド/プラットフォーム技術の知見に基づき、DWH、BI、ETL領域におけるソリューション開発を推進します。https://enterprise-aiiot.nttdata.com/recruitment/career_sp/cloud_engineer
2. データサイエンス領域(データサイエンティスト/データアナリスト)
データ活用/情報処理/AI/BI/統計学などの情報科学を活用し、よりデータサイエンスの観点から、データ分析プロジェクトのリーダーとしてお客様のDX/デジタルサクセスを推進します。https://enterprise-aiiot.nttdata.com/recruitment/career_sp/datascientist
3.お客様のAI活用の成功を推進するAIサクセスマネージャー
DataRobotをはじめとしたAIソリューションやサービスを使って、 お客様のAIプロジェクトを成功させ、ビジネス価値を創出するための活動を実施し、 お客様内でのAI活用を拡大、NTTデータが提供するAIソリューションの利用継続を推進していただく人材を募集しています。4.DX/デジタルサクセスを推進するデータサイエンティスト《管理職/管理職候補》
データ分析プロジェクトのリーダとして、正確な課題の把握、適切な評価指標の設定、分析計画策定や適切な分析手法や技術の評価・選定といったデータ活用の具現化、高度化を行い分析結果の見える化・お客様の納得感醸成を行うことで、ビジネス成果・価値を出すアクションへとつなげることができるデータサイエンティスト人材を募集しています。ソリューション紹介
Trusted Data Foundationについて
~データ資産を分析活用するための環境をオールインワンで提供するソリューション~https://enterprise-aiiot.nttdata.com/tdf/
最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。
TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について
~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~https://enterprise-aiiot.nttdata.com/service/tdf/tdf_am
TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。
NTTデータとTableauについて
ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。
NTTデータとAlteryxについて
Alteryxは、業務ユーザーからIT部門まで誰でも使えるセルフサービス分析プラットフォームです。 Alteryx導入の豊富な実績を持つNTTデータは、最高位にあたるAlteryx Premiumパートナーとしてお客さまをご支援します。導入時のプロフェッショナル支援など独自メニューを整備し、特定の業種によらない多くのお客さまに、Alteryxを活用したサービスの強化・拡充を提供します。
NTTデータとDataRobotについて
DataRobotは、包括的なAIライフサイクルプラットフォームです。 NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。NTTデータとInformaticaについて
データ連携や処理方式を専門領域として10年以上取り組んできたプロ集団であるNTTデータは、データマネジメント領域でグローバルでの高い評価を得ているInformatica社とパートナーシップを結び、サービス強化を推進しています。NTTデータとSnowflakeについて
NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。 NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。 Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。タグ:Alteryx