この記事のターゲット
・Tableau使ってる方でPythonやデータサイエンティスト等に興味を持ち始めた人。
・逆にPython使ってる方でTableau等のBIツールに興味のある人
等
この記事を書いた背景
2024年夏から半年間マナビDXでAI開発(機械学習)を学びました。
機械学習を学習していく過程でEDA(探索的データ分析)で様々なツールを活用するようになりました。
最近は、Data Wrangler等をよく使うのですが、2024/11からTableauコミュニティ資格のDATA Saberにチャレンジ中なので、Tableauライクな可視化ツール「PyGWalker」の紹介をしたいと思います。
PyGWalkerとは?
Python環境で動く、Tableauライクな可視化ツールです。
PyGWalkerは、Pythonのデータ分析ツール(Pandas)と直感的なUIを組み合わせたツールで、Tableauライクな操作感で操作出来ます。
PyGWalkerの特徴とTableauとの違い
PyGWalkerの特徴
・Tableauに似たインターフェースで、データの可視化がドラッグ&ドロップで簡単にできる。
・コードを書く量を大幅に削減しつつ、Python内で分析ワークフローを完結できる。
・Altairベースで軽量かつ拡張性が高い。
Tableauとの違い
・TableauはWindowsやMacにインストールするソフトウェアですが、PyGWalkerはPython環境上で動作するソフトウェアです。
・PyGWalkerは無料で利用が出来、GUI上でのドラッグ&ドロップ以外に「スクリプト・コードベース」で分析も行えます。
・Tableauより動作は軽量だが、出来ない事も多い。
・UIが英語なので慣れるまで少し大変かも。
PyGWalkerを始める準備
自分のPC上で動かしたい場合はPython環境の構築が必要(わからない方は「Python anaconda」とかで調べてね)ですが、オンライン上でPythonが動かす事が出来るGoogle Colab等でも動かす事が可能です!
Google Colabの使い方は割愛しますが。
# 必要なライブラリをインストール ※各自足りないものを追加インストール
!pip install pygwalker
# 必要なライブラリを使えるようにする(PandasとPyGWalker)
import pandas as pd
import pygwalker as pyg
# PyGWalkerで使用するデータファイルを読み込む。
df = pd.read_csv(r'サンプル - スーパーストア.csv', encoding='utf-8')
# PyGWalkerを実行
walker = pyg.walk(df)
なんと、たったこれだけのプログラムコードでPyGWalkerを利用できます。
UIが英語ですがTableauユーザーならさほど困らないんじゃないかと思います。
よく使う項目として下があるのですが、左から
・連続・不連続の変更
・チャートの変更
・スタックモードの変更
そのまま(None)、積み上げ(Stack)、や正規化(Normalize)、ピラミッド※正負の値を中心(Center)
現在、使い方を勉強中
Pythonのプログラムコードを書かなくても直感的にableauライクで可視化が出来るPyGWalker。
私も使い方の勉強中で
・値を表示できないの?
・色をもっと柔軟に設定できないの?
・Centerがズレる時があるんだけど?
等など、課題がたくさんあります。
でも簡単に可視化できる「PyGWalker」は便利!
もう少し使い慣れたら情報を追記したいと思います。(`・ω・´)
参考URL
PyGWalker(https://chatgpt.com/c/678f7409-bf24-8003-ad92-8b265cc9c97c)
Google Colab(https://colab.research.google.com/?hl=ja)
DATA Saber(https://datasaber.world/)
マナビDXクエスト(https://dxq.manabi-dx.ipa.go.jp/)