1. sksk_go

    Posted

    sksk_go
Changes in title
+[備忘録]Pythonで特定のclassの内容をスクレイピングする
Changes in tags
Changes in body
Source | HTML | Preview
@@ -0,0 +1,56 @@
+#概要
+PythonのBeautifulSoup4で特定のページの特定のclassの内容を取得する方法のメモ。
+
+#インストール
+必要なライブラリをインストール
+
+```
+$ pip install beautifulsoup4
+```
+
+#スクレイピング
+Qiitaの自分のプロフィール欄を題材に試してみます。
+
+![キャプチャ.PNG](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/248994/7241ca3f-ca91-9c9b-3a88-c624616ae7a3.png)
+
+自分の記事一覧から各記事のタイトルを取得します。
+
+
+##ソースコードはこちら。
+
+
+```python:scraping.py
+#モジュールのインポート
+import urllib.request
+from bs4 import BeautifulSoup
+
+#対象のサイトURL
+url = "https://qiita.com/sksk_go"
+
+#URLリソースを開く
+res = urllib.request.urlopen(url)
+
+#インスタンスの作成
+soup = BeautifulSoup(res, 'html.parser')
+
+#head内のタイトルタグを取得
+name = soup.find_all("div", class_="ItemLink__title")
+
+#取得したタイトル情報を出力
+ret = []
+for t in name:
+ ret.append(t.text)
+
+print(ret) # ['item1', 'item2', ~]
+```
+
+##実行結果
+```
+$ python scraping.py
+['AIに自分の顔を判定させたら失敗した話(番外編)', '○○に似てると言われ困ったので、AIに判定させてみた', 'obnizで夏っぽいことしてみた', 'LINEで減塩量を可視化しようとした話', 'IoTを活用して、ただいまと言ったらおかえりが返ってくる仕組みを
+作る', '悩める恋心を助けるためのLINE Botを作ってみた']
+```
+
+成功してますね。
+
+業務でもたまに使うのでメモ代わりに。