Plotly | Databricks on AWS [2023/1/31時点]の翻訳と追記です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Plotlyは、インタラクティブなグラフのライブラリです。DatabricksではPlotly 2.0.7をサポートしています。Plotlyを使うには、Plotly PyPIパッケージをインストールし、クラスターにアタッチします。
注意
Databricksノートブックでは、Plotly Offlineを使用することをお勧めします。大規模なデータセットを取り扱う際に、Plotly Offlineがうまく動作しないことがあります。パフォーマンス問題に気づいた際には、データセットのサイズを削減する必要があります。
Plotlyのプロットを表示するには:
- Plotlyの
plot()
関数の引数としてoutput_type='div'
を指定します。 -
plot()
関数の出力をDatabricksのdisplayHTML()
関数に渡します。
サンプルのノートブックをご覧ください。
Plotly Pythonノートブック
from plotly.offline import plot
from plotly.graph_objs import *
import numpy as np
x = np.random.randn(2000)
y = np.random.randn(2000)
# Instead of simply calling plot(...), store your plot as a variable and pass it to displayHTML().
# Make sure to specify output_type='div' as a keyword argument.
# (Note that if you call displayHTML() multiple times in the same cell, only the last will take effect.)
p = plot(
[
Histogram2dContour(x=x, y=y, contours=Contours(coloring='heatmap')),
Scatter(x=x, y=y, mode='markers', marker=Marker(color='white', size=3, opacity=0.3))
],
output_type='div'
)
displayHTML(p)
よりシンプルなサンプルはこちらです。
from plotly.offline import plot
# x軸とy軸のデータ
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
# 散布図の作成
p = plot(
[Scatter(x=x, y=y, mode='markers')], output_type='div'
)
displayHTML(p)