LoginSignup
0
0

More than 1 year has passed since last update.

Dataiku:データ準備のための人気機能のご紹介

Last updated at Posted at 2022-07-29

アナリストは、データ準備の作業に大半の時間を費やしており、それは分析の作業の中で最も退屈な部分とされています。データ準備が大好きな人も、もう二度とデータセットのクレンジングを担当したくない人も、Dataikuのデータ準備の機能には、データ準備作業をより効率的に(そして、より我慢できるように)するために設計されています。ここでは、プラットフォーム内で最も愛されている機能のいくつかを紹介します。

1. ビジネス側のステークホルダーやデータサイエンスチームとのコラボレーションを容易にするビジュアルフロー

ビジネス側のステークホルダーやデータチームに分析を提供した後、その結果がどのように得られたかについて質問を受けることがよくあります。しかし、スプレッドシートや他のデータ準備ツールを使いながら、データセットを整理、変換、クレンジングする際に行ったさまざまなアクションをすべて説明するのは難しい場合があります。Dataikuでは、データパイプラインの各ステップが図示されたビジュアルフローが生成され、関係者にどのような変換をを行ったかを簡単に説明するために使用できます。これにより、関係者は分析の背景にあるステップをより良く理解し、出力結果に対してより自信を持つことができるようになります。
FlowWithTags.png
このDataikuのビジュアルフローの例では、データパイプラインの各ステップを誰が担当したかの情報がタグづけられています。どのような処理が行われたか、より簡単に理解しステークホルダーに説明できます

2. データソースや使用言語に関係なく、データの収集、クレンジング、変換を高速化するデータ変換機能

複雑なスプレッドシート関数が、適切なデータ準備機能を使えば大規模なデータセットに対してより簡単に実行できます。Dataikuはビジュアルツールの形で100以上の組み込み型のデータ変換機能を備えており、迅速にクレンジング、結合、集計、再形成、フィルター、ジオコード処理など多くの変換を行うことができます。また、処理をコミットする前に、各変換のプレビューを見ることができます。さらに、各変換は個別に表示したり、グループ化やラベル付けをしたりできるため、なにが起きているかすべて完全に把握することができます。

また、必要であれば、使い慣れたスプレッドシートのような言語でカスタム数式を書いたり、カスタム変換のためのコード(SQL、それ以外も使用可能)を書くオプションもあります。ビジュアルツールを使ってスピードを重視するか、カスタムコードを書いて柔軟性を重視するかは、どちらでもお好きな方をお選びいただけます。

PrepareRecipe.png
Dataikuの準備レシピの例で、搭載済みの変換機能やカスタム変換がデータセットに適用されています。これらの変換を整理して理解しやすくしています

3. 必要なデータソースに簡単に接続できるビルトインデータコネクター

クラウドストレージ、オンプレミスデータベース、エンタープライズアプリケーションに対応した数多くのデータコネクターを使用して、必要なデータに簡単にアクセスし、データ準備機能を最大限に活用することができます。どこからデータを取り込んでもデータは見慣れた表形式で表示されるので、スプレッドシートのデータ作成ツールに慣れたアナリストに最適です。サポートされているコネクターの一覧は、こちらをご覧ください。

4. ネイティブなデータ可視化と統計解析

データを他のツールに出力することなく、データプレパレーションのどの段階でも、25種類以上のチャートと視覚的な統計分析を活用して、データをすばやく探索し、パターンを特定することができます。その後、機械学習モデルの作成と展開、関係者向けの自動レポートダッシュボードの作成へと簡単に移行することができます。すべての処理を単一のインターフェースで行うことができるのです。
Screen Shot 2021-10-05 at 12.55.27 PM.png
Dataikuに備わっている地理空間ビジュアライゼーションの一例

v10_augEDA.png
Dataikuは、データに基づいて有用と思われる統計分析を提案できます

5. 作業の共有と再利用で時間短縮

Dataikuのデータ準備機能により、再利用や共有可能なプロジェクト資産のように、関連する過去の作業を見つけ、知識を活用することが簡単にできます。レシピをコピー&ペーストしたり、ワークフローを再利用可能なビジュアルコンポーネントとしてパッケージ化したり、キュレーションされたリファレンスデータを中央のフィーチャーストアに公開することが可能で、 時間の節約とチームのためのベストプラクティスを容易に構築できます。

11_FeatureStore2.png
Dataikuのフィーチャーストアでは、データサイエンスや分析プロジェクトのための機能を保存し、再利用することができます

6. 自動化:反復的なデータ準備のタスクを最小限に抑えます

多くの場合、毎回同じデータ準備作業を伴うレポートをステークホルダーのために作成する必要があります。Dataikuを使えば、このようなレポート作成タスクの大部分を、シナリオを使って自動化することができます。
Scenario gif.gif
繰り返し行われるデータ準備作業を自動化するために使用できるシナリオの例

データ準備のその先へ

Dataikuの得意な機能はデータ準備だけに留まりません。セルフサービスアナリティクスからAutoMLまで、アナリストに役立つ他の機能の詳細については、こちらのデモビデオをご覧ください。



原文: Top Data Preparation Software Features in Dataiku

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0