対象
Apache Sparkをやるにはどれから始めたらいいかわからない方。
Apache Spark関連のリンクをまとめます。主に英語がおおいです。Edxのコースはとてもお勧めです。動画で説明があり、Pythonで実際にコードをかいて学んでいくのでとても理解しやすいです。
I will keep you updated! なにか他にいいリソースありましたらコメントください。
本家
Overview
Compile and Run Example
このポストは1.4ですが、1.5でも同じはずです。
Edx
Introduction to Big Data with Apache Spark
Scalable Machine Learning
Bigdata university
- http://bigdatauniversity.com/bdu-wp/bdu-course/spark-fundamentals/
- http://bigdatauniversity.com/bdu-wp/bdu-course/spark-fundamentals-ii/
Papers
- RDD
- Shark(Spark SQL)
- Spark (1.4) profile
- Spark streaming
日本の企業の方のslide share(NTTな方々がおおいですね。
- http://www.slideshare.net/hadoopxnttdata/apache-spark
- http://www.slideshare.net/hadoopxnttdata/apache-spark-spark
- http://www.slideshare.net/hadoopxnttdata/hadoop-14006572
- http://www.slideshare.net/hadoopxnttdata/hadoop-ecosystem-nttdata-osc15tk
- http://www.slideshare.net/hadoopxnttdata/hadoopsiliconvalleytechbusinessmeetup
- http://www.slideshare.net/taroleo/spark-internal-hadoop-source-code-reading-16-in-japan
Books
- Learning Spark
- Advanced Analytics with Spark
- Spark in Action (in progress)
- Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク (2015/10/20発売 NTTDATAから)
探すといろいろでてきますが、どうなんでしょうか。以下はまだ読んでません。
-
Spark cookbook
-
Fast dataprocessing with Spark
-
Machine Learning with Spark
-
Apache Spark Graph processing
-
Mastering Apache Spark
Spark summit
- https://spark-summit.org/2013/
- https://spark-summit.org/2014/
- https://spark-summit.org/2015/
- https://spark-summit.org/east-2015/
- https://spark-summit.org/the-spark-spot/
Others
- AMP Lab, where spark was invented
- https://amplab.cs.berkeley.edu/
- Reynold personal page (Spark PMC)
- http://www.cs.berkeley.edu/~rxin/
- Matei Zaharia personal page (Spark inventor, PMC, CEO of Databricks and Associate Professor in MIT)
- http://people.csail.mit.edu/matei/
- MLbase, base of Spark MLlib
- http://mlbase.org/
Meetup in Japan
- http://connpass.com/event/8465/
- http://cloudera.connpass.com/event/18857/
- http://www.meetup.com/Tokyo-Spark-Meetup/
Commit email (kouさんに作っていただきました。感謝。
差分が色付けされているので本家のcommit emailよりも見やすいです。下記で購読できます。
To: apache-spark@ml.commit-email.info
Cc: null@commit-email.info
Subject: Subscribe
--
subscribe