1
3

More than 1 year has passed since last update.

Googleニュースをpythonで取得する(RSS利用)

Posted at

Googleニュースをpythonで取得したくて、試した内容を備忘録的にメモしておきます

ライブラリを使ってみた(断念したもの)

まず初めに以下のライブラいを試してみました
https://pypi.org/project/GoogleNews/
しかし取れるデータが2年前くらいになってしまったので使用を断念しました。
(日本のニュースだと駄目なのかな?)

最終的に使ったもの

色々調べると以下のサイトでGoogleNewsのRSSが取れることを知りました。
https://qiita.com/KMD/items/872d8f4eed5d6ebf5df1

その後にfeedparserを使いました。

$pip install feedparser

そしてRSSのデータは日付が以下のような形式のため、datetimeを使って変換しました。

Sun, 02 Oct 2022 03:28:43 GMT

最終的なものは以下のもの(シンプルなもの)

import feedparser
import datetime

keyWord = '田中先生'
rssDatas = feedparser.parse('https://news.google.com/rss/search?q=%27' + keyWord + '%27&hl=ja&gl=JP&ceid=JP:ja')
for rssData in rssDatas.entries:
  # 日付を変換
  updateTime=  datetime.datetime.strptime(rssData.published, '%a, %d %b %Y %H:%M:%S GMT').strftime('%Y/%m/%d')
  print('----'*30)
  print('タイトル:',rssData.title)
  print('日時:',updateTime)
  print('リンク:',rssData.link)

取得できたデータは以下のようなもの

タイトル: 小倉唯さんがCVを担当!Switch/PS4『サマータイムレンダ Another Horizon』ゲームオリジナルキャラクターを公開(アスキー) - Yahoo!ニュース - Yahoo!ニュース
日時: 2022/09/21
リンク: https://news.yahoo.co.jp/articles/f3ae199a29626f98c916a0653ee58f85abe5f524
------------------------------------------------------------------------------------------------------------------------
タイトル: 串カツ田中HDは「助成金頼み」てなんとか黒字化…本格離陸はいつになるのか?(有森隆)(日刊ゲンダイDIGITAL) - Yahoo!ニュース - Yahoo!ニュース
日時: 2022/09/15
リンク: https://news.yahoo.co.jp/articles/27f1fed68d182444d3dcceb31fde5b62b4ba3c77
------------------------------------------------------------------------------------------------------------------------
タイトル: 【国際日本学部】田中絵麻ゼミナール「ICTを活用して、日本が抱えるさまざまな課題を解決する政策や企業の取り組みを研究!」 - MEIJI NOW
日時: 2022/09/26
リンク: https://meijinow.jp/study/seminar/73021
1
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
3