More than 5 years have passed since last update.

Amazon Elastic Mapreduce

Posted at 2015-07-06

Qwik labs を引き続きやっていきます！！

今日はAmazon Elastic Mapreduce　をやります。

そもそもAmazon Elastic Mapreduceとはなんぞや？？

要するに Hadoop をAWSに埋め込んだみたいな感じらしいです。
この解説がとても分かりやすいです。

ここで前提としてHadoopの理解があげてあるのでslideshareで載せておきます。
http://www.slideshare.net/hamaken/hadoop-cloudera-world-tokyo-2014

要するにHadoopとは。。。？

➡大量のデータを処理するときに複数のサーバーを利用してよりスムーズにしていくもの。
　googleの論文を元に開発されたとか。。。

早速　やっていきましょーーー

まずはサインインをしてS3のコンソールを選ぶ

ここでbucketを作成

名前のところでemr-bucket-○○○　＊○○○のところには名前のイニシャルを入れる

また、リージョンは今いる場所以外のものを選ぶと高くなるらしいのでTOKYOを選択。

bucket完成！！

次にEMRのコンソールへ

手順はこんな感じです。

続いてはタグセッション。

次にHardware configurationセッション

次にsecurity and access

ここではEC2のペアーキーなしで進みます。

あとはOK押すだけです。クラスターはこんな感じに見えます。

クラスターをモニタリングできます。まずは、クラスターリストをクリック

こんな感じでモニタリング

ここで問題発生。結果を見ようとS3へ
ここでの指示が「output folderを選択してください」

ところがそんなもんないよーーーー

同じ質問を発見

しかし、stackoverflowで誰かが答えてました！！

すげーーー

恐るべし。。。

僕も無事できました。！

stackoverflow　やばいっすね。

みなさん、コメントお待ちしております。