LoginSignup
3
1

More than 5 years have passed since last update.

「地下ホテル」の情報をスクレイピングしてみた!

Last updated at Posted at 2018-11-21

皆さんは中国・上海市の「地下ホテル」を聞いたことがありますか?

今日、中国・上海市に世界で最も海抜の低い5つ星ホテル「インターコンチネンタル上海ワンダーランド(InterContinental Shanghai Wonderland)」が正式開業しました。このホテルは、2002年まで安山岩の採石場だった場所で、深さ88m、幅280mほどの巨大な穴の中に建てられたことから「地下ホテル」や「深い穴のホテル」とも呼ばれています。ホテルは崩れやすく複雑な形をした穴の壁面に建設されたため、構想から完成まで12年かかって、ようやく今年、完成しました。

ソーシャルメディアで大きな話題を集めているこのホテルは今日から宿泊を受け付けますが、初日はすでに予約でいっぱいになっています。宿泊料金は1泊、日本円で6万〜170万円らしいです。
5587608.jpg
微信图片_20181120180753.jpg

開業するに、このホテルの真実はメディアに公開され、世界中の記者たちも惹かれています。日本のメディアが報道した後、多くの日本ネチズンは非常に好評し、一度行きたいと言いました。
Catch2961.jpg

今回はちょうど最近リリースされた新機能:タスクテンプレートを利用して、Twitterから皆さんの「地下ホテル」に対する評価を取得しようと思います。Octoparseの新しいタスクテンプレートは、誰でも簡単にWebスクレイピングを利用できるように設計されています。あらかじめ作成されたタスクテンプレートを使用すると、スクレイピングタスクを設定する必要はありません。すぐに使用できるタスクテンプレートは学習時間を短縮し、すぐにデータを取得できます。

さて、始めましょう!

1. Task Templatesの下にある「 +Task」をクリックします。
图片1.png

2. Social Mediaをクリック、Twitter → Tweetsを選択します。それから「Use template」をクリックします。
图片1.jpg

3. キーワード「地下ホテル」を入力します。必要に応じて、Task nameとTask groupを変更できます。
图片5.png

4. 「Save and run」をクリックして、「Local Extraction」または「Cloud Extraction」(有料版のみ)を選択し、タスクを実行します。
图片6.png

いかがでしょうか?簡単でしょう!タスクテンプレートを使うと、プログラミング知識の少ない/ない人でも簡単にWebスクレイピングを達成できます。パラメータ(ターゲットページのURL、検索キーワードなど)を入力するだけで、データがどんどん抽出されてきます。この時点で、Amazon、Indeed、Instagram、Twitters、YouTube、食べログなどの多くの人気サイトがカバーされています。皆さんも試してみてください。

取得したツイートを簡単に分析したところ、だいたい2種類分けられます。一つは「このホテルすごい、行ってみたい!」で、もう一つは「崩れたり、水没したりなどの恐れがあり、行きたくない」です。皆さんはどう思いますか?

ネチズンの評価とは別に、この「地下ホテル」にもっと詳しいために、メディア側の情報をより多く収集しました。ここでは、皆さんに紹介したいと思います。

佘山は中国の国家レベル森林公園で、上海の裏庭とも呼ばれます。風景が美しくて、毎年数多くの観光客が訪ねてきています。しかし、公園の南側にある採石場がどうもしっくりこない気がします。2006年、シマオグループ(Shimao Group)はこの深い穴を改装し、廃棄された採石場に世界初の5つ星ホテルを建設し、この「傷跡」を世界の注目を集める「ダイヤモンド」に変えようとしました。

複雑な地盤のために工事は難航で、完成まで12年かかり、20億元(約326億円)を費やし、この超豪華なホテルは完壁に完成されました。中国メディアによると、マグニチュード9規模の地震にも耐えられる構造だということで、アメリカのナショナルジオグラフィックチャンネル「NG Megastructures」による「世界の建築奇跡トップ10」の1つに選ばれました。
微信图片_20181120180906.jpg

すごいと思わない?もし余裕があれば、一度でも行ってみましょう!

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1