【365日後にPredictive Master】大企業の平社員がAlteryx Weekly Challengeに挑む #006

Posted at 2025-05-01

はじめに

こんにちは、積立お兄さんです。
大企業新卒３年目のAlteryx初心者です。
ひょんなことから「365日後にPredictive Masterになる！」という目標を掲げて、公式のWeekly Challengeにコツコツ挑戦しています。

この記事では、Alteryx歴3か月の平社員が、実務で生かせそうなノーコード分析力をどうやって身につけていくかを記録＆共有していきます。

data列の各値は同じ文字数であり、n文字目の文字を見て最頻の文字を採用していくことで、あるメッセージが浮かぶようになっている。それを解読するために以下の手順でフローを構築した。

フォーミュラツール　：各行の文字数をカウントする（後の処理で使用する）
行生成ツール　　　　：data列の各文字列に対して、文字数分の行を作成する。index列を作成することで、data列の各値に対して、indexのn番目ごとに最頻がどれかを確認するための準備を行った。（日本語下手）
フォーミュラツール　：substring()を使用して、data列の各値に対して一文字ずつ抽出を行う。
substring(対象の文字列, 開始位置, 長さ)
対象文字列：[data]
開始位置：[index]-1
長さ：1
対象文字列はいわずもがな。開始位置は0対象文字列の0番目から指定する。今回の場合は、indexが1からスタートしているので、[index]-1とすることで１文字目から順番に１文字ずつ抽出するようにしている。
集計ツール　　　　　：indexとsubstringでグループ化し、substringでカウントを行う。
各indexごとに最頻の文字を選択するため、各indexごとに各文字数をカウントする。
ソートツール　　　　：indexで昇順、Countで降順ソート。
サンプリングツール　：indexでグループ化し、最初の1行目のみをサンプリングする。こうすることで、各indexの最頻の文字を抽出することができる。
集計ツール　　　　　：substring列を連結させる。

問題１：ある文字列から１文字ずつ抽出する方法がわからない
→ フォーミュラツールのsubstring()を使用することで、１文字ずつ抽出することができる。
問題２：最頻の文字を抽出する方法がわからない
→ 初め、集計ツールを使用して、その中の最頻モードを使おうとしたが、それだと１文字ずつ設定する必要があり、汎用性が無かった。
→ カウントしてソートし、その１番上の行を抽出するようにしたことで、シンプルで簡単になった。

→正しい出力フォーマットで、指定要件を満たしていました！

次は【Weekly Challenge #007】に挑戦予定！
さらっと進めましたが、実は005をスキップしております。問題の意味が頭の悪い私にはわかりませんでした...