CDH5の環境でSpark 2.0を試してみる
ClouderaのHadoopディストリビューション、CDH5の最新版(CDH5.8)には Apache Spark 1.6 が同梱されています。一方、今年の6月にはSparkの新しいメジャーバ...
8 search resultsShowing 1~8 results
You need to log-in
ClouderaのHadoopディストリビューション、CDH5の最新版(CDH5.8)には Apache Spark 1.6 が同梱されています。一方、今年の6月にはSparkの新しいメジャーバ...
Apache Kudu Apacheライセンスなオープンソースの分散ストレージエンジン 低遅延でランダムアクセスできる高速なカラムナストレージ Apache Impala (Incubating...
Apache FlumeやApache Kafkaはリアルタイムなイベント処理のバックエンドとして広く利用されています。これら2つのシステムは似ている部分もありますが、ユースケースによりどちらか...
目的 Apache SparkのWebUIはアプリケーションのデバッグにとても役立ちます。 デバッグのため、このWeb UIを使って本番環境で取得したログを検証環境で確認したいことがあります。 ...
Apache Kudu (http://kudu.apache.org/) がApacheプロジェクトのTLP(トップレベルプロジェクト)になったので、最新のQuickstart VMを使って試...
Cloudera Enterprise 5.8 がリリースされたので、Cloudera Quickstart VMのCloudera ManagerとCDHをアップグレードしてみました。 環境 ...
データフローが必要な背景 Hadoop(HDFS)にデータを集めてSparkやMapReduceで処理を行いたい場合、データのパイプラインを作る必要があるかもしれません。Hadoopエコシステム...
Cloudera Managerを使ってセットアップしたData CollectorのGUIからデータフローを作成します。 StreamSetsのドキュメントにあるチュートリアルに従って作ってみ...
8 search resultsShowing 1~8 results
Qiita is a knowledge sharing service for engineers.