Storage TypeとMeaning
Storage Type
csvファイルを読み込む際は、Storage Typeの方は全て文字型になります。
DBなどからインポートする際は、型が決まっているため基本的には変更するべきではないです。
結合する際、例えば、user_idでjoinしたい場合、一方が文字列型で、一方が数値型の場合
結合することはできない。
Meaningとは?
Dataikuは上記で記載したように、元データからカラムの型を取得します
Dataikuはそれとは別に列の値の性質を反映した型も検出します。
dataikuには、米国の州、IPアドレス、電子メールなど、多くの概念が組み込まれています。
また、この枠を見ると、緑色と赤色のバーがあります。
値を見ると、所々赤色になっています。
これが、meaningが得た型と違うということを示唆しています。
とってもUIが見やすいですね。
Chartsとは
取得したデータをグラフ等で可視化できます。
したの赤枠をクリックすると出てきます。
では簡単な操作を説明します。
ドラックアンドドロップして X・Y軸に入れる感じです
どこかとなくTableauに似ています。
下のカテゴリを見ると、カテゴリが一緒の要素っぽいですが
別々のカテゴリとなってしまっていますね。
これは修正する必要があります。
それには『レシピ』が必要になります。
レシピ
Dataikuでいうレシピとは、小難しく言ってますが『前処理』ですね
1つまたは複数の入力データセットに対して実行するアクションのセットであり、結果として1つまたは複数の出力データセットになります。
下の図でもわかるように、
・コードレシピ
・ビジュアルレシピ
の2種類があります
名前の通り、GUIでやるかコードをつかってやるかの違いですね。
複雑な処理はコードレシピが必要になってくるそうです。
下の順番で進みます。
変更したいカラムを選択して『Analyze』をクリックします
その後、同じカラムであろうものにチェックをして、Mearge selectedを選択します。
これを繰り返すことで、要素の前処理がGUIで可能になります。