授業の概要
該当章 | 第3章:情報システムが支える社会 |
---|---|
該当節 | ネットワークを利用した犯罪 |
情報収集と調査 | |
めあて | 「webスクレイピング」という技術のメリットとデメリットを使用者側の視点に立って考える |
成績評価基準
本クラスではA〜Cで個人の授業に関する評価をつけていく。
成績に応じた対応とA到達要件 | |
---|---|
Aの学生の要件 | 本授業で扱ったコードの1行1行がどのような処理をしているのかを説明でき、他サイトのスクレイピングができるようになる。またサイトの規約やAPIの正しい使い方を踏まえた上でWebスクレイピングを使うことができる。 |
Cの学生に対してのサポート | 本授業で扱ったコードの1行1行の理解を補助。ウェブスクレイピングの危険性を知り、ウェブサイトに応じた正しい使い方を把握する方法を説明できるようになるまでサポートする。 |
Webスクレイピングとは
【演習】(5分で調べ、まとめましょう)
Webスクレイピングとはどのような技術でしょう。またメリット・デメリットを挙げましょう。
=======(授業内で共有)========
Webスクレイピングを実際試してみよう
実際にpythonでかいたwebスクレイピングのコードを試し、どのような値が返ってくるのかを確かめましょう。
皆さんはこのwebスクレイピングで、何のサイトの、**どんなタグの情報(liタグ、imgタグなど)**を抽出したいでしょうか??
ウェブサイトの規約に応じたスクレイピングを行いましょう。
- instagramをスクレイピングして、個々のユーザの写真を抽出できたらなぁ…
- TwitterやFacebookをスクレイピングして、個々のユーザの投稿を抽出できたらなぁ…
- 企業のTechブログをスクレイピングして、タイトルを抽出し、その文言から自分の知見を深めたいなぁ…
などなど、Webスクレイピングでやりたいことが増えている今日このごろです。
しかし
安易に個人情報にアクセスしやすい技術ということで、instagramをはじめとしたSNSはスクレイピングやAPI使用に関する規約を定めています。
【演習】(15分で調べ、まとめましょう)
instagramやTwitterのような大規模なSNSの運営サイトを3つ選び、それぞれスクレイピングに関する規約の文言をサーベイしましょう。サーベイをもとに、正しい判断で使うための方法をまず隣の人と話し、お互いの共有が終わり次第同じテーブル内のメンバーと意見交換しましょう
また出席確認も兼ねて、この記事に今日の知見や授業の感想をコメントしてください。