スクレイピング技術を活用すれば、ウェブ上の情報を効率的に収集できます。特に、食べログのような飲食店情報サイトのデータを取得し、分析に活用したいと考えている方も多いでしょう。しかし、「食べログのスクレイピングは違法なのか?」「利用規約で禁止されているのか?」と疑問に思う人もいるはずです。
そこで本記事では、食べログの利用規約やルールを確認し、スクレイピングの適切な方法を解説します。
なお、スクレイピングの違法性や、禁止しているWebサイトがある理由について知りたい方は、以下の記事をご参考ください。
参照:Webスクレイピングは違法?合法的なやり方と禁止サイトの確認方法を解説
食べログをスクレイピングすることは禁止?
食べログは、国内最大級のグルメレビューサイトです。全国のレストラン情報や、実際に利用したユーザーの口コミが掲載されています。
この膨大な情報を活用すれば、営業リストの作成や市場調査データの整理など、さまざまな用途に役立てることができます。食べログの情報収集を効率化するために、スクレイピングを活用したいと考える方も多いでしょう。
ここでは、食べログの利用規約やrobots.txtの内容を確認し、スクレイピングが可能かどうかを詳しく解説します。
食べログの利用規約
はじめに、食べログの利用規約を確認してみましょう。
現在の食べログの利用規約(2025年3月時点)では、スクレイピングという言葉は明確に禁止されていません。しかし、「当社の事前の同意なく、食べログの提供する情報を複写、再生、複製、送付、譲渡、頒布、配布、転売、またはこれらの目的で保管することは禁止」と明記されています。
利用規約のポイント
食べログの利用について
- お客様は、当社が提供する食べログについて、その全部あるいは一部を問わず、営業活動その他の営利を目的とした行為又はそれに準ずる行為やそのための準備行為を目的として、利用又はアクセスしてはならないものとします。また、その他、宗教活動、政治活動などの目的での利用又はアクセスも行ってはならないものとします。
- 食べログへ投稿された口コミを無断転載・無断利用することは禁止します。ただし、当該投稿をした本人は除きます。
- 口コミを投稿した本人による当該口コミの利用等本規約が特に認めた場合を除き、食べログに掲載されている口コミを利用して利益を得た場合には、当社はその利益相当額の金員を請求できる権利を有するものとします。
禁止行為
- 法令上又は本規約若しくはガイドライン上特に認められている場合を除き、食べログの提供する情報を当社の事前の同意なく、複写、若しくはその他の方法により再生、複製、送付、譲渡、頒布、配布、転売、又はこれらの目的で使用するために保管すること
引用:食べログ利用規約
この規約のポイントは、スクレイピングで得たデータの「利用方法」によって規約違反となる可能性があることです。個人的な研究や内部でのデータ分析目的であれば問題になりにくいですが、データを第三者と共有したり、商用利用したりする行為は規約違反に該当します。
従って、食べログのスクレイピングは規約違反とは言い切れませんが、データの利用方法によっては問題になる可能性があります。ルールを守り、慎重に活用することが重要です。
食べログのrobots.txt
robots.txtは、ウェブサイトの管理者がクローラー(検索エンジンやスクレイピングツール)がアクセスできる範囲を指定するファイルです。食べログのrobots.txtを確認すると、特定のページやディレクトリへのアクセスが制限されています。
具体的には、以下のディレクトリがDisallow(アクセス禁止)になっています。
- /ad_mobile/
- /rvwr/*/visitdtl/
- /yoyaku/tabelog_booking/
- /blog/to_blog
- /btb/
これらの指定から、食べログは一部の機能に対するスクレイピングを制限していることがわかります。しかし、全てのデータ取得が禁止されているわけではなく、一般的な店舗情報ページなどには特に制限がありません。
また、各検索サイトクローラーに対して、Crawl-delay(クロール遅延)が5秒や10秒で設定されています。
食べログのデータをスクレイピングする際は、同様の間隔でデータを収集した方が良いと言えます。
食べログはスクレイピングを明確には禁止していない
食べログの利用規約やrobots.txtを確認した結果、食べログはスクレイピングそのものを明確に禁止しているわけではありません。ただし、利用規約ではデータの無断利用や商用目的での使用を禁止しており、robots.txtでは一部のページへのアクセス制限が設けられています。
結論として、食べログのスクレイピングは「全面禁止」ではなく、「適切なルールのもとでなら可能」と言えます。
Octoparseを使った食べログのスクレイピング方法
食べログのデータをスクレイピングする方法には、Pythonなどのプログラミング言語を利用する方法もありますが、非エンジニアにとっては難易度が高い作業です。
そこで便利なのが、Octoparseのようなノーコードのスクレイピングツールです。Octoparseを使えば、プログラミングの知識がなくても、簡単な操作でデータを取得できます。本章では、Octoparseを使って食べログのデータをスクレイピングする手順を解説します。
ステップ1. 食べログでデータ収集したいページURLを取得する
食べログのWebサイトにアクセスし、スクレイピングしたいレストラン情報のページを開きます。そのページのURLをコピーします。
ここでは、「銀座・新橋・有楽町」エリアを選択します。
ステップ2. Octoparseを起動し、食べログのテンプレートを選択する
Octoparseを立ち上げ、トップページの検索画面に「食べログ」と入力し、スタートを押します。
食べログのテンプレートは3つありますが(2025年3月時点)、ここでは「食べログ グルメ店リスト」のテンプレートを選択します。テンプレートの詳細画面に遷移するので、内容を確認し、「今すぐ試す」をクリックします。
ステップ3. スクレイピングタスクを開始する
先ほどコピーした食べログのURLを貼り付けます。
複数のURLを入力した場合でも、自動的に順番にスクレイピングが実行されるため、効率的にデータを取得できます。入力が完了したら、「保存実行」ボタンを押します。
タスクの実行モードは、「ローカル抽出」 または 「クラウド抽出」の2種類から選択できます。
クラウド抽出はOctoparseの有料プランで利用可能です。サーバー上で並列処理を行うため、スクレイピング速度が大幅に向上します。
一方、ローカル抽出は無料プランでも利用可能です。ローカル抽出でも十分データを取得できるため、まずは無料プランで試してみてもよいでしょう。
タスクが開始されると、データの抽出が始まります。
スクレイピングが完了すると「実行が完了しました!」のメッセージが表示されます。
エクスポート形式はExcel、CSV、HTML、JSONから選べます。今回は、わずか数分で100件以上の店舗リストを作成できました。
まとめ
本記事では、食べログのスクレイピング方法や注意点について詳しく解説しました。
食べログのスクレイピングは利用規約上、全面的に禁止されているわけではないものの、データの取り扱いには細心の注意が必要です。
特に、無断転載や商用利用は禁止されており、スクレイピングしたデータを外部で使用する場合は規約違反となる可能性があります。個人の研究や内部分析の範囲で利用することが重要です。
手軽にスクレイピングを実施し、法的リスクを回避したい場合は、Octoparseのようなノーコードツールを活用するのがおすすめです。
本記事を参考に、適切なルールのもとでスクレイピングを活用しましょう。