6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

dockerでSPARK SQL

Last updated at Posted at 2015-11-19

DockerでSPARKを。

といっても、コンテナを一から作成するのは大変なので、sequenceiq/sparkを使わせてもらいます。
投稿時点では、1.5.1が最新でした。

Dockerのインストールは省略

因みに使用バージョンは1.9.0

Docker pull

といっても、導入に関しては下記に記載してくれているのでそのまま実行します。
https://hub.docker.com/r/sequenceiq/spark/

1.5.1

pull出来たら実行ですが、4040ポートも足してあげたいので下記のように。

> docker run -it -p 8088:8088 -p 8042:8042 -p 4040:4040 -h sandbox --name="spark" sequenceiq/spark:1.5.1 /bin/bash

起動したら、

> cd /usr/local/spark
> bin/spark-sql --master yarn-client

Hadoop

yarnで起動したので、下記からクラスタを見れる。
http://127.0.0.1:8088/cluster

All Applications 2015-11-20 00-20-41.png

hostsにsandbox 127.0.0.1を追加しておけば、リンクからSpark Jobsも見れます。

SparkSQL::172.17.0.3 - Details for Stage 1 (Attempt 0) 2015-11-20 00-22-32.png

dockerだからいぢったらcommitしておかないと後で泣いちゃうかも。

6
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
7

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?