概要
Google Search Consoleを使うことでGoogle検索での表示回数・掲載順位を把握したり、SEO上の問題点を修正してWebサイトの注目度を高めることができます。しかし、絶えず集められるデータをその都度分析し、最新の状態に保つのにはコストがかかります。そこで今回は、troccoという分析基盤向けデータ統合サービスを使い、Google Search Consoleデータの抽出自動化+DWH(データウェアハウス)への統合+可視化までやってみようと思います。
今回、データの転送手段として採用したtroccoは、Google Search Consoleの他にも、様々な広告・CRM・DBなどのデータソースにも対応しています。
troccoの使い方まとめ(CRM・広告・データベース他)
ゴール
Google Search Consoleのデータを下のようにAmazon Redshiftに統合し
Lookerで可視化します(作成後は自動で最新値に更新することも可能です)
こんな人におすすめ
・Search ConsoleのデータをRedshiftに自動的に蓄積させたい
・Google検索での表示回数・掲載順位について自動的に分析できるようにしたい
・Google Search Consoleをデータ元として利用したい
1. troccoでGoogle Search Console→Amazon Redshiftの転送自動化
1-0. 事前準備
データの転送のためにはtroccoのアカウント・Googleアカウントが必要です。
無料トライアルを実施しているので、事前に申し込み・登録しておいてください!
https://trocco.io/lp/index.html
(申込の際に、この記事を見た旨を記載して頂ければご案内がスムーズに行えます)
1-1. 転送元・転送先を決定
troccoにアクセスして、ダッシュボードから「転送設定を作成」のボタンを押します。
転送元に「Google Search Console」を指定し、転送先に「Amazon Redshift」を選択して転送設定作成ボタンを押します。
すると、設定画面になるので、必要な情報を入力していきます。
1-2. Google Search Consoleとの連携設定
あとで見たときに自分で分かるように転送設定の名前とメモを入力します。
次に「転送元Google Search Consoleの設定」内の「接続情報を追加」ボタンを押します。
別のタブでGoogle Search Consoleの接続情報の新規作成画面が開きます。
接続情報を作成するためにJSON Keyが必要になります。
問題がなければ保存します。再度転送設定画面に戻り、接続情報の「接続情報を読み込む」ボタンを押すと、先ほど作成した接続情報が選択できるようになります。
1-3. Google Search Consoleからのデータ抽出設定
次に、どのようなデータを取得するかを設定していきます。
今回は分析したいサイトについての日付、検索クエリ、リンクに関する情報を取得していきます。
必要なデータを入力していきます。
○サイトURL
転送したいデータのサイトURLを指定してください。
○サーチタイプ
web, image, video
の中から選択します。
今回はwebページ(https://trocco.io/) の分析を行うので「web」を選びます。
○データ取得期間
Google Search Consoleの仕様上、取得できるデータは3日以上前のデータに限られるので要注意です。
○ディメンション
データの取得結果をグループ化するための項目です。
date, country, device, page, query, searchAppearance
を指定することができます。
1-4. 転送先Amazon Redshiftの設定
転送元と同様に設定していきます。まず、Redshiftの接続情報を作成していきます。
転送先となるRedshiftの接続先ホスト、接続先ポート、ユーザー名、パスワードを設定し、AWSのアクセスキーIDとシークレットアクセスキーを設定する必要があります。
AWSのアクセスキーとシークレットアクセスキーの取得方法は以下の通りです。
1.IAM コンソール を開きます。
2.ナビゲーションメニューで [ユーザー] を選択します。
3.IAM ユーザー名 (チェックボックスではありません) を選択します。
4.[認証情報] タブを開き、次に [アクセスキーの作成] を選択します。
5.新しいアクセスキーを表示するには、[表示] を選択します。認証情報は次のようになります。
6.アクセスキー ID: AKIAIOSFODNN7EXAMPLE
シークレットアクセスキー: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
キーペアをダウンロードするには、[.csv ファイルのダウンロード] を選択します。キーを含む .csv ファイルを安全な場所に保存します。
先ほど作成した接続情報を選択し、データベース名、スキーマ、テーブルなど必要な情報を設定していきます。(データベース、スキーマ、テーブルは事前にRedshiftで作成しておく必要があります。)
これで入力は完了です。「保存して自動データ設定・プレビューへ」をクリックし、確認作業に進みましょう。
1-5. データのプレビュー
少し待つと、転送元のデータがプレビューされます。ここではGoolge Search Consoleから取り込んだデータが表示されています。
転送したいデータが取れているので、設定を完了します。
転送設定の一覧から作成した設定を選び「スケジュール・通知設定」に進みます。
1-6. スケジュール・通知設定
「スケジュール・トリガー設定」タブを開きます。
「スケジュールを追加」ボタンを押すと、以下のようなモーダルが出てきます。ここで実行スケジュールを設定することで、転送を定期的に実行し自動化することが出来ます。
1-7. データ転送ジョブの実行
設定は以上です。最後に、手動で転送ジョブを実行し、Redshiftにデータを送ります。
手動で実行する場合はジョブ詳細画面の「実行」ボタンを押します。
これで転送は完了です!
2. Amazon Redshiftの設定
特に設定することはありません。設定で選択したテーブルにデータが転送されているので、今すぐに分析・可視化を行うことが出来ます。
データがきちんと送られているかをプレビューで確認してみます。
クエリエディタにSQL文を入力し、データをSELECTします。
SELECT * FROM qiita_test_fromsearchconsole.qiita
転送されていることが確認できました!
3. Lookerで可視化
まずはRedshiftとLookerを接続します。 管理タブを開いて「データベース」の「接続」を開きます。
接続しているデータベース一覧が表示されています。ここで「Add Connection」を選択し、接続設定を行う画面が表示れるので、情報を入力していきます。
Redshiftのデータベースに接続できたら、次はデータを可視化するために必要なLookMLプロジェクトを作成します。 開発タブを開いて「LookMLプロジェクトの管理」に移動します。
「New LookML Project」からLookMLプロジェクトを作成します。
「Create Project」を押したら、エディタでmodelとviewを定義します。 後々必要になるので、modelの中ではexploreを設定しておきましょう。 (書き方が分からない場合はLookerの公式ドキュメントを参照してください)
これで下準備が整いました。 トップページに戻って「New」からDashboardを作成します。
白紙のダッシュボードが作成されるので「Qiita_Searchconsole_Redshift」と名前をつけます。
そして「Dashborardの編集」→「タイルの追加」を選択し、先ほどのmodel内で定義したExploreを選択します。
ディメンションとメジャーを設定し、Tileに表示したいデータをプロットします。例えば、リンクにおける広告の表示回数について分析したいとき、ディメンションに「リンク」とメジャーに「インプレッション数」を選択します。
今回はクリック数、インプレッション数を分析したいのでダッシュボードにまとめていきます。
完成しました!
まとめ
いかがでしたでしょうか。troccoを使うと、Google Search Consoleのデータでも自動でAmazon Redshiftにまとめていくことができるほか、100万規模の大きなデータからそうではない小さなデータまで複雑なコーディングをせずtroccoの画面上の設定のみでデータの転送が可能になります。
実際に弊社サービスのtroccoにおいても、マーケティングKPI等をこのような流れで収集・分析しています。
ぜひ広告データ分析の際にはご活用ください。
https://trocco.io/lp/index.html
実際に試してみたい場合は、無料トライアルを実施しているので、この機会にぜひ一度お試しください。(申込時に、この記事を見た旨を記載して頂ければスムーズにご案内することができます)
その他にも広告やデータベースなど、様々な分析データをETL・転送した事例をまとめました。
troccoの使い方まとめ(CRM・広告・データベース他)