LoginSignup
16
16

More than 5 years have passed since last update.

Spark 1.4の新機能Spark UIのVisualizationを試す

Last updated at Posted at 2015-06-17

スクリーンショット 2015-06-17 10.38.26.png

Spark 1.4がリリースされました。
機能追加についてはリリースノートを参照。
https://spark.apache.org/releases/spark-release-1-4-0.html

一番すぐに試せるのはDAGのモニタリングやSparkStreamingのモニタリングができるVisualization機能の追加でしょう。
これは得に既存のコードの改変も必要なくライブラリを1.3から1.4にすればSparkUIですぐ試せます。

SparkUI http://localhost:4040/

Spark1.4 + SparkStreamingを利用するbuild.sbt

version := "1.0"

scalaVersion := "2.10.5"

libraryDependencies += "org.apache.spark" %% "spark-core" % "1.4.0"
libraryDependencies += "org.apache.spark" %% "spark-streaming" % "1.4.0"
libraryDependencies += "org.apache.spark" % "spark-streaming-twitter_2.10" % "1.4.0"

Twitterからデータをリアルタイムに取得しSparkStreamingで取得集計するプログラムを書く

今回つかったフル版のソース
https://github.com/AKB428/mikasa_ol/tree/feature/spark14

スクリーンショット 2015-06-17 11.57.19.png

http://lovelive-net.com/5/
http://lovelive-net.com/60/

こんな感じで毎分、直近5分、直近60分のTwitterワード集計ランキングを行うプログラムを走らせる

Spark起動


sbt
run

SparkUI にアクセス

Sparkを動かしているのが外部サーバー(VPS等)ならSSHポートフォワードする

ssh -L 14040:XXX.XXX.XXX.XXX:4040 user@server_hostname

XXX.XXX.XXX.XXXがサーバーIP

この場合はport14040にアクセスする。

スクリーンショット 2015-06-17 10.35.31.png

Event lineを押下

スクリーンショット 2015-06-17 10.36.10.png
スクリーンショット 2015-06-17 10.36.16.png

青い四角を押下

DAG Visualizationを押下(たぶん直近のものしかデータが見れない)

スクリーンショット 2015-06-17 10.37.58.png

スクリーンショット 2015-06-17 10.38.26.png

スクリーンショット 2015-06-17 12.06.39.png

Timeline Eventを押下

スクリーンショット 2015-06-17 10.41.26.png

Spark Streaming タブを押下

スクリーンショット 2015-06-17 10.39.26.png

16
16
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
16
16