0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

サイトのタイトルのみをスクレイピングするツール

Posted at

機能一蘭

・A列のURLにサイトトップページのURRLを記入する。
・スクリプトを実行するとメディアに対応したタイトルが上から記入される。
・B列がすでに埋まっている時は飛ばし、B列内で空白のセルを探しそこからスタートする。

function myFunction() {
  //1. 現在のスプレッドシートを取得
  var spreadsheet = SpreadsheetApp.getActiveSpreadsheet();
  //2. 現在のシートを取得
  var sheet = spreadsheet.getActiveSheet();
  //3. 指定するセルの範囲(A列)を取得
  const lastRow = sheet.getLastRow();
  for(let i = 2; i <= lastRow; i++) {
    //A列を取得
    var range = sheet.getRange(i,1);
    //制限時間対策のためB列に値が入っているときはスキップする
  if(sheet.getRange(i,2).getValue() !== ""){
  continue;
  }
    var value = range.getValue();
    var response = UrlFetchApp.fetch(value);
    var html = response.getContentText('UTF-8');

  /////③タイトルタグの抽出/////
    //開始文字列の指定
    var start_str = "<title>";
    var start_num = html.indexOf(start_str)+start_str.length;

  //終了文字列の指定
    var end_str = "</title>";
    var end_num = html.indexOf(end_str);

  //タイトルタグをスクレイピング
    var title = html.substring(start_num, end_num);

  //結果の出力
    Logger.log(title);
  //B列にタイトルを記入
    sheet.getRange(i, 2).setValue(title);
  } 
}

メディアの競合リサーチの際に役に立つと思うので使ってみてください。
他にも作成していきます。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?