13
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Data Wrangler for VSCode を試してみる

Last updated at Posted at 2023-05-15

Data Wrangler for VSCode を試してみる

Data Wrangler とは

現在パブリックプレビュー中のデータ探索、前処理用のツールです。

Image from Gyazo

Github のリポジトリに記載のコンセプト訳文:

Data Wranglerは、パンダコードを自動的に生成し、洞察に満ちた列統計と視覚化を表示する豊富なユーザーインターフェイスを提供することにより、データクリーニングを行うデータサイエンティストの生産性を向上させることを目的としています。

引用元:Github Repo

VSCode の拡張機能があるので、試してみます。

market place

使ってみる

  1. まずは拡張機能をインストールします ※Python インストール済みのWin環境です。
    Image from Gyazo

  2. ctrl + P でVSCode コマンドパレットを呼び出してみます。

  3. >Open Walkthrough を起動すると ガイドが立ち上がります。
    Image from Gyazo

  4. Step 1 Open Data Wrangler → Open file in Data Wrangler をクリックして、対象のファイルを選択します。
    Image from Gyazo

    今回はAzure ML チュートリアル の定期預金申込の予測モデル用データである、bankmarketing_train.csv を利用します。

  5. 初めて機能を利用する場合、 python/jupyter カーネルに接続するための画面が表示されますので、任意の環境を選択します。
    Image from Gyazo

  6. もしカーネルに必要な(pandasなど)が不足している場合、インストールに進みます。
    Image from Gyazo

  7. インストールが完了すると、データファイルをロードして、テーブルビューが表示されます。
    Image from Gyazo

    画面中央では、それぞれの列ごとの統計情報とレコードが表示され、左側ペインでは、上から Operations(処理内容の一覧)Data Summary(テーブル全体の統計情報)Cleaning Steps(行った処理ステップ) が表示されています。

  8. はじめに列を絞り込んでみます。Select Columns の処理を一覧から選択すると、列を選択するためのメニューに移動します。
    Image from Gyazo

  9. age(年齢)と、Y(定期預金フラグ)に絞り込んでみました。Apply をクリックします。
    Image from Gyazo

  10. 処理結果が表示されます。この状態で一度 Preview code for all steps をクリックすると、実施した処理がpandasコードとして生成されていることがわかります。
    Image from Gyazo

  11. 次に、年齢を年代で表現するための列を追加します。Settings で By Example operationをチェックしましょう
    Image from Gyazo

  12. Operation の一覧に New Column by example が表示されるので、これをクリックします。

    Image from Gyazo

  13. 対象列と追加列名を入力します。

    Image from Gyazo

  14. 緑色で表示される例入力欄に値を入れると、規則が予測され、残りの値が自動生成されます。

    Image from Gyazo

  15. pandas 側も式が生成されています。10で割って小数点を丸めたあと10倍して戻すといったところでしょうか。

    Image from Gyazo

  16. Export to Notebook をクリックすると、生成されたコードを含む ipynb ファイルが生成されます。
    Image from Gyazo

以上です。簡単なデータ処理は十分のように思いますし、サクサク探索できて結構いい感じのツールでした。ぜひご確認してみてください。

13
12
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
13
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?