興味深かったので訳しました。著者はDomino Data Labのアナリストの方です。
「コードファーストのデータサイエンスは賢明ではない」ベンダーの宣伝を一日中聞いているのだとしたら本当なのだろうと推察します。本当のデータサイエンティストと会話すれば、彼らがなぜコードを書いているのかを知ることでしょう。以下にそれらのいくつかを示します。
スピード 1行のコードを書くのは数行です。「ノーコード」ツールは遅いです。メニュー、サブメニュー、サブサブメニューをクリックします。キャンバスにオペレーターをドラッグします。右クリックしてオペレーターを設定します。
コードの書き方を知っているのであれば、「ノーコード」ツールの操作は地獄で暮らすようなものです。
機能性 コードは「ノーコード」ツールよりもリッチであり、多くの場合、5倍から10倍豊富です。同じソフトウェアにおいて、ドラッグ&ドロップのUIとコードベースのAPIを比較してください。ソフトウェアの開発者は、「ノーコード」インタフェースに組み込む前にAPIに新機能を組み込みます。多くの機能はノーコードバージョンに取り込まれることはありません。これは、数多くのオペレーターをグラフィカルなUIに取り込むには制限があるためです。
柔軟性 「ノーコード」ツールは一部の機能しかサポートしていないため、開発者は重要と考えるものにフォーカスします。シンプルな分析を行っているのであれば問題ありません。そうでなければ不幸なことになります。コードは無制限の柔軟性を持っています。これが、データサイエンス向けのすべての「ノーコード」ツールに、ユーザーがコードを挿入できるような「コードノード」機能がある理由です。
私は、ワークフローのそれぞれのシングルノードがコードノードである「ノーコード」ツールで作業が行われたのを見たことがあります。
透明性 コードはありのままであり、検査に対してオープンです。「ノーコード」ツールではこれは常に真となりません。データサイエンティストは、自分の作業の精度に対して説明責任を持ちます。分析が適切ではなかったとしても、ツールに文句を言うことはできません。コーディングをしているのであれば、データから洞察に至る処理パイプラインは完全に可視化されます。
効率性 誰もゼロからコーディングはしません。データサイエンスチームは再利用なコードのコンポーネントを整理し、共有します。実行性能を改善し、計算インフラストラクチャに対するインパクトを最小化するために、コードを調整、チューニングすることができます。これはノーコードツールでは不可能です。
コードを取り扱うことは、AutoMLのようなイノベーションの取り扱いを除外することではありません。すべての先進的なAutoMLツールはコードベースのAPIをサポートしています。ベストなAutoMLツールは拡張可能です。エキスパートのデータサイエンティストはアルゴリズムにコードを追加できます。多くのAutoMLツールは、エキスパートがレビュー、修正、チューニングできるようにコードパッケージとしてパイプラインを提供します。
コーディングスキルは恐ろしいものではありません。Pythonスキルを持つ人材プールは、経験のあるデータサイエンティストのプールを上回っています。もちろん、Pythonの知識でデータサイエンティストになれる訳ではありません。データサイエンティストには、プログラミング以上の知識とスキルが求められます。しかし、これがまさにポイントであり、コーディングスキルはデータサイエンティストの供給を制限する重要なボトルネックではありません。
「コードファースト」のデータサイエンスは、高速、機能的、柔軟、透明で効率的です。コードを取り扱うデータサイエンティストは、機械学習と人工知能において最も先進的なイノベーションを活用することができます。すべての有望なデータサインティストは、すでに少なくとも一つのプログラミング言語を知っています。多くは多言語を取り扱っています。
いくつかのタスクでは「ノーコード」ツールは好適なものです。例えばグラフィックやダッシュボードです。データサイエンティストは、多くの場合必要に応じてコードベースツールとこれらのツールを組み合わせて活用しています。また、「ノーコード」ツールはシンプルな分析では優れていると言えます。多くのマネージャーとアナリストは「ノーコード」ツールを好みますが、これは問題ありません。
しかし、マネージャー、アナリストとデータサイエンティストを混同しないでください。もし、私が電球をねじ込めるとしても、これは「シチズンの電気技師」とは言えません。電球を持っている住人に過ぎません。