LoginSignup
0
0

WindowsでのPySparkの環境構築

Last updated at Posted at 2023-10-11

PySparkとは

PySparkとはApache SparkのPython APIのことである。

WindowsでのPySparkの環境構築

1.PySparkの裏側ではJavaが動いているのでJavaをインストールする。

2.Sparkの公式ページからApache Sparkをダウンロードする。

3.Windowsで動かすにはwinutilsが必要なので、以下よりダウンロードする。winutilsは、Apache Spark展開後のbin配下に格納する。

 https://github.com/steveloughran/winutils

4.環境変数を設定する。コントロールパネルから「システムとセキュリティ」を選択。「システム」をクリックし、「システムの詳細設定」を検索し、「環境変数」をクリック。

  • HADOOP_HOME:C:\spark-2.4.5-bin-hadoop2.7

  • PATH:$HADOOP_HOME\binを追加

5.spark-shellコマンドを実行し起動確認する。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0