例えば、VORKERS( http://www.vorkers.com/ )という会社評価のクチコミサイトで、個別の企業ページの情報を複数取得したい場合、まずは企業ページのURLを得る必要があります。しかし、企業名と企業ページURLに関連性がない場合(ページURLが連番で生成されているなど)、1つずつ手動で企業ページURLを取得するのは面倒です。
そこで、サイト上でキーワード検索をし、検索結果から企業ページのURLを取得すると便利です。
やり方
下記のようなGoogleスプレッドシートを想定し、説明します。
B1セル
に、検索したい企業名を入力します。続いて、B3セル
、B4セル
、B5セル
にはそれぞれ下記のように関数を入力します。すると、B5セル
にB1セル
に入力したキーワードで検索した結果ページのURLが表示されます。
B3セル
="http://www.vorkers.com/search.php?src_str="&B1
B4セル
=IMPORTXML(B3,"//div[@class='table-noSequence_companyName']/a/@href")
B5セル
="http://www.vorkers.com/"&B4