LoginSignup
10
9

More than 5 years have passed since last update.

RSS1.0とRSS2.0で記事を取得するコード

Posted at

PHPでRSS1.0、RSS2.0で記事を取得する方法です。
以下のコードで、タイトル、URL、投稿日(タイムスタンプ)がとれます。

RSS1.0

    $rss = simplexml_load_file("RSS1.0のURL");
    $array = array();
    foreach ($rss->item as $item) {
        $dc = $item->children('http://purl.org/dc/elements/1.1/');
        $array[] = array('title'=>$item -> title,'url' => $item -> link, 'date' => strtotime($dc->date));

    }

RSS2.0

    $rss = simplexml_load_file("RSS2.0のURL");
    $array = array();
    foreach ($rss->channel->item as $item) {
            $array[] = array('title'=>$item -> title,'url' => $item -> link,'date' => strtotime($item -> pubDate));
    }

アメブロ

アメブロではRSSの間に自動的に広告が組み込まれます。
なので、上記のRSS2.0のコードで記事を取得しようとすると
広告も取得してしまいます。

幸いなことに広告のタイトルには必ずPRという文字が入るという規則性があるので、
PRが含まれていなければ配列に追加するという風に修正しています。

広告じゃなくても、
タイトルにPRが含まれていたら弾かれてしまうのが難点です。

    $rss = simplexml_load_file("アメブロのRSSのURL");
    $array = array();
    foreach ($rss->channel->item as $item) {
        if(!strstr($item -> title,'PR')){//タイトルにPR(広告)が含まれていなければ配列に追加
            $array[] = array('title'=>$item -> title,'url' => $item -> link,'date' => strtotime($item -> pubDate));
        }
    }
10
9
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
9