1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Udemy ビジネスパーソンに贈る業務効率化大全 〜Google Apps Scriptによる業務の自動化〜 セクション12:業務効率化⑨:Web情報を可視化する(Webスクレイピング)

Posted at

Webスクレイピング・ワークフロー

Webスクレイピングとは、Webページなどから情報を取得すること。

ワークフロー

  1. GASを用いて、Webページから情報を取得する。
  2. スプレッドシートに取得した情報を反映させる。

必要な知識

  1. 外部ライブラリを読み込む方法(簡単に作業が出来る。)
  2. Webスクレイピングを行う方法

## 外部ライブラリを読み込む

  1. GAS内のリソースからライブラリを選択
  2. 外部ライブラリ(M1lugvAXKKtUxn_vdAG9JZleS6DrsjUUV)をペーストし保存

入手したい情報を取得してくる

入手したい情報(今回ならば受講者数とレビュー数)を取得する。

gas
function scraping() {
  var url = 'https://scraping-for-beginner.herokuapp.com/udemy';
  var response = UrlFetchApp.fetch(url);
  var content = response.getContentText('UTF-8');
  
  var parser = Parser.data(content);
  
  var subscribers = parser.from('<p class="subscribers">').to('</p>').build();
  subscribers = Number(subscribers.split(':')[1]);
  
  var reviews = parser.from('<p class="reviews">').to('</p>').build();
  reviews = Number(reviews.split(':')[1]); 
  
  var today = new Date();
  return[today, subscribers, reviews];
}

シートに書き込む

シートとGASを連携させ、sheet.getEangeで情報を書き込む。

gas
function writeData(){
  var results = scraping();
  var ss = SpreadsheetApp.getActiveSpreadsheet();
  var sheet = ss.getSheetByName('データ');
  
  var lastRow = sheet.getLastRow();
  sheet.getRange(lastRow+1, 1, 1, 3).setValues([results]);
}

##最後に
洗練さんでインターン(Udemy ビジネスパーソンに贈る業務効率化大全 〜Google Apps Scriptによる業務の自動化〜 セクション12:業務効率化⑨:Web情報を可視化する(Webスクレイピング))です。
Udemy ビジネスパーソンに贈る業務効率化大全 〜Google Apps Scriptによる業務の自動化〜 セクション12:業務効率化⑨:Web情報を可視化する(Webスクレイピング)

最後に
現在ここでインターンしています。
まだまだ駆け出しですが頑張ります!やる気は人一倍です!
洗練

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?