はじめに
フィードを提供していないWebページのRSS化はいくつか記事がありますが、RSS化サービスが続々終了していたりするため、2016/12/08現在利用できるものを投稿しておきます。
使用するサービス
Feed43 : Convert any web page to news feed on the fly
FEED43独自のスニペットを使用した正規表現を登録することにより、HTML内から自由に内容を抽出します。HTMLが分からないと使えませんが、柔軟に抽出箇所を指定できます。
FEED43の使い方
Step 0. FEED43にアクセス
下記にアクセスして「Create your own feed」をクリック。
Feed43 : Convert any web page to news feed on the fly
Step 1. Specify source page address (URL)
下記のストックページのURLを記入して「Reload」をクリック。
http://qiita.com/<user_name>/stock
Step 2. Define extraction rules
下記のスニペットを使用して抽出ルールを指定する。
-
{*}
: 任意の文字列に一致する文字列(抽出対象としない) -
{%}
: 任意の文字列に一致する文字列(抽出対象とする)
面倒な場合は、「Item (repeatable) Search Pattern」に下記のルールを使用してください。
(改行はダメです)
<article {*}><a {*}><img {*} src="{%}" /></a><div class="media__body"><div class="ItemLink__info"><a href="{%}">{%}</a>が{%}に投稿 {*}</div><div class="ItemLink__title"><a class="u-link-no-underline" href="{%}">{%}</a></div>{%}</div>{*}</article>
下記のように、データが抽出されたら成功です。
-
{%1}
: 投稿したユーザーのサムネイルへのURL -
{%2}
: 投稿したユーザーのユーザーページへのURL -
{%3}
: 投稿したユーザーのユーザー名 -
{%4}
: 投稿日 -
{%5}
: 記事のURL -
{%6}
: 記事のタイトル -
{%7}
: タグリスト
注意 : 繰り返しアイテムの中で更に繰り返しができなかったので、タグは<ul>
ごとごっそり取ってきています。
Step 3. Define output format
フィードアイテムの内容を指定し、「Preview」をクリック。
ここでは、簡単に、タイトル/URL/タグのみを出力しています。
Step 4. Get your RSS feed
「Feed URL is: ***.xml」の部分をクリックすると、フィードのxmlにアクセスできます。