2年ほど前、そろそろDataikuを使いこなそうと思いました。しばらくの間、Dataikuのマーケティング・コンテンツ・チームの一員として働いていたので、もちろんソフトウェアについては高いレベルで熟知していましたが、その時点では、私の仕事で洞察を得るためにDataikuを使用する必要はなく、ただ消費するだけでした。でも興味は持っており、学びたいと思っていました。そして、かなり厄介なビデオマーケティングデータのかたまりという形で機会がやってきて、私はこの機会に飛びつきました。Dataikuユーザーとしての私の旅が始まったのです。
技術者ではない多くのビジネスユーザーと同様に、私のデータ操作の経験は、Microsoft Excelを適度に使用する程度でした。Dataikuを使い始めたとき、私はその興奮と不満について書き記しました。そして今回、そのときよりは経験豊富なユーザーとして、スプレッドシートからDataikuへの移行中に発見した主な課題とわくわくするベネフィットをいくつか(ブログシリーズの形で)共有しようと思いました - そして、なぜこれらのベネフィットが当初の課題を完全に上回るものであったか、についてを。
課題: なぜこのセルに入力できないのか?
私がDataikuを使い始めて最初に苦労したことは(私だけではないと思いますが)、Dataikuのデータセットはスプレッドシートではないので、スプレッドシートのようにセルを編集することはできないということを理解し、慣れることでした。
表計算ソフトでは、データを変換したりエンリッチメントしたりするために、表計算ソフトのセルに直接データポイントを入力したり、置き換えたり、計算処理をしたりしますが、Dataikuでのデータ変換は、データセットに作用する変換ロジック、またはコマンド(「ステップ」とも呼ばれる)を含むレシピによって実現されます。
恥ずかしながら、Dataikuを使い始めて最初の30分ほどは、データセットのセルをクリックして入力しようとしていました。おそらく、雑誌のページをタッチスクリーンのように「スワイプ」しようとする子供のバイラルビデオのように見えたのではないかと思います。しかし、最初は困難に思えたことも、最終的には非常にありがたいベネフィットとなりました。
ベネフィット: 視覚的にデータ処理ができる世界、データ損失の懸念はなし
レシピを作成したり、設定を変更したり、変換ステップを追加したりしてデータを準備することに最初は違和感がありましたが、スプレッドシートでは考えられなかったほど高度で効率的な方法でデータを準備することができました。通常のソート、フィルタリング、新しいカラムの計算から、複雑な地理空間データの処理、テキストデータからパターンを抽出するための正規表現の使用まで、Dataikuのビジュアル化されたデータ準備インターフェースのコツを掴めば、不可能なことは何もないように思えました。
一番良かった点は?すべての変換がレシピ設定に記録され、変換前のデータセットがそのまま残っているので、データやプロセスが失われることはありませんでした。Dataikuと扱いにくいスプレッドシートとの主な違いは、データに変換を適用する際に、元の(または入力した)データセットがワークフローで利用可能なままであるということです。レシピでは「出力」データセットを作成するので、元のデータを失う心配をすることなく多くのさまざまな変換処理を適用することができ、また、簡単に以前のバージョンに戻ることができます。
スプレッドシートで "失敗 "してパニックになり、必死になって以前のバージョンに戻そうとしていた時代は終わりましたが、同時にどうしてそうなっていたのかも忘れていました。私のように、仕事でもプライベートでも、そろそろスプレッドシートを卒業したいと感じている方は、Dataiku Academyの新しいExcel to Dataiku Quick Startコースをチェックしてみてください。次回は、スプレッドシート廃止後の私の生活について、より詳細な情報をお伝えします。
原文:[*The Challenges and (Awesome) Benefits of Switching From Spreadsheets to Dataiku*](https://blog.dataiku.com/spreadsheets-to-dataiku)
高度にビジュアル化されたGUIで、データサイエンティストやデータエンジニア、ビジネスアナリストなど、あらゆるタイプのユーザー様にお使いいただけるツールDataikuを、せひ一度ご覧ください!
Dataikuのデモはこちら