Graph analysis tutorial with GraphFrames | Databricks on AWS [2022/6/9時点]の翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
このチュートリアルノートブックでは、グラフ分析を行うためにどのようにGraphFramesを使うのかを説明します。GraphFamesの最適化されたインストレーションが含まれているので、Databricks機械学習ランタイムを使うことをお勧めします。
ノートブックを実行するには:
-
Databricks機械学習ランタイムが実行されているクラスターを使っていないのであれば、これらの方法を用いてGraphFramesライブラリをインストールします。
-
KaggleからBay Area Bike Shareデータをダウンロードして解凍します。サードパーティの認証を用いてKaggleにサインインするか、Kaggleアカウントを作成してサインインする必要があります。
-
Explore and create tables in DBFSで説明されている方法で
station.csv
とtrip.csv
をアップロードします。テーブル名は
station_csv
とtrip_csv
になります。
GraphFramesによるグラフ分析ノートブック