1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

dataiku-basic-tutorialを受けてみた(その1)

Posted at

Storage TypeとMeaning

Storage Type

csvファイルを読み込む際は、Storage Typeの方は全て文字型になります。

DBなどからインポートする際は、型が決まっているため基本的には変更するべきではないです。

結合する際、例えば、user_idでjoinしたい場合、一方が文字列型で、一方が数値型の場合
結合することはできない。

Meaningとは?

Dataikuは上記で記載したように、元データからカラムの型を取得します
Dataikuはそれとは別に列の値の性質を反映した型も検出します。

dataikuには、米国の州、IPアドレス、電子メールなど、多くの概念が組み込まれています。

image.png

また、この枠を見ると、緑色と赤色のバーがあります。
値を見ると、所々赤色になっています。

これが、meaningが得た型と違うということを示唆しています。
とってもUIが見やすいですね。

image.png

Chartsとは

取得したデータをグラフ等で可視化できます。
したの赤枠をクリックすると出てきます。

image.png

では簡単な操作を説明します。
ドラックアンドドロップして X・Y軸に入れる感じです
どこかとなくTableauに似ています。

image.png

下のカテゴリを見ると、カテゴリが一緒の要素っぽいですが
別々のカテゴリとなってしまっていますね。
これは修正する必要があります。

それには『レシピ』が必要になります。

image.png

レシピ

Dataikuでいうレシピとは、小難しく言ってますが『前処理』ですね
1つまたは複数の入力データセットに対して実行するアクションのセットであり、結果として1つまたは複数の出力データセットになります。

下の図でもわかるように、
・コードレシピ
・ビジュアルレシピ
の2種類があります

名前の通り、GUIでやるかコードをつかってやるかの違いですね。

複雑な処理はコードレシピが必要になってくるそうです。

下の順番で進みます。

image.png

変更したいカラムを選択して『Analyze』をクリックします

image.png

その後、同じカラムであろうものにチェックをして、Mearge selectedを選択します。

image.png

これを繰り返すことで、要素の前処理がGUIで可能になります。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?