WITH句を3ステップに分けることでSQLのメンテナンス性を高めよう
複雑な分析要件に対応するSQLクエリは、しばしば長大化し、理解やメンテナンスが難しくなることがあります。しかし、SQLのWITH句(CTE: Common Table Expression、共通...
29 search resultsShowing 1~20 results
You need to log-in
複雑な分析要件に対応するSQLクエリは、しばしば長大化し、理解やメンテナンスが難しくなることがあります。しかし、SQLのWITH句(CTE: Common Table Expression、共通...
はじめに dbt snapshot を使うと、プロダクト側の改修を行わずとも、データベースの履歴(スナップショット)を記録することができます。 参考)公式の紹介記事 スナップショットはSCDタイ...
この記事について この記事はdatatech-jp Advent Calendar 2024の12月7日分として記載しています はじめに 私たちは、マーケティング施策や新規機能開発など、業務の中...
データ分析において、データはディメンション(分析軸)としてもファクト(指標)としても使われることがあります。 そのため、データソースが同じ1列だから、Looker でもそのまま dimensio...
TL;DR 以下の手順を踏むと、元のexploreの全てのjoinを継承し、ベーステーブルのみを差し替えられる いずれかを選択する a. 継承元のexploreにおいて、ベーステーブルをview...
TL;DL データマネジメントにおいて、緩やかに変化する値は"Slowly Changing Dimension"と呼ばれる アプリケーション側のDBが値を上書きする仕様になっていた場合、過去の...
これは何 データマネジメント・データ分析に関する書籍・記事・ツールをまとめます。 特に価値が高いと思う書籍・記事を上に並べています。 どのような分野が存在するのか概観します。 全て読むのは大変な...
2値分類モデルの予測値を確率として使用する際はCalibrationを行う必要があるらしいので調べました。 概要 Calibrationとは 広告のクリック率(CTR)予測など、2値分類モデルの...
A/Bテストを行う際、施策を打ったことによる効果を推定するだけでなく、推定値がどれだけ信頼出来るものなのかを計算することはとても重要です。 そこで、効果の推定誤差と信頼区間を導出します。 例) ...
はじめに 状態空間モデルにおいて状態を逐次的に推定する有名な手法の1つにカルマンフィルタというものがあります。 カルマンフィルタなどを用いて出来る事・概要・手順・numpyを用いた行列実装をまと...
これは何 UNNESTの複数の使い方を組み合わせることで、SQLを大幅に短く書く方法を紹介します。 課題設定 ユーザーu毎に2列のパターンt1,t2と値vを持つログがあるとします。 ユーザー×パ...
TL;DR 共変量が時変の生存時間分析を行いたい場合、離散時間ロジスティック回帰という手法を使うことが出来ます。 離散時間ロジスティック回帰の紹介と、stanによる実装を行います。 始めに 大学...
HMDもWindowsPCもつよつよグラボも何も持っていない人が、WindowsクラウドGPUサーバーを使ってvket4に遊びに行くためのやり方をまとめます。 所要時間は30分~1時間ほどです。...
やること データサイエンス用のDockerコンテナといえばjupyter公式が配布しているscipy-notebookがありますが、Dockerfileを見るとcondaベースで書かれています。...
pip3のパッケージをワンライナーで雑に一括アップデート出来なかったので、シェルスクリプトを書きました。 実行後にpip3 checkで依存関係を確認しましょう。 # !/bin/zsh # 更...
初めに javascriptベースで手軽に対話的な操作が可能な作図が出来るPlotly Express(公式サイト)というライブラリが少し前に公開されたのを見つけました。 今までの静的な作図とは...
普段シェルスクリプトを書かないのでメモっておく "d"で始まって"1"か"2"で終わる全てのディレクトリの中にある全てのファイルを数え上げる n_files=0 for dir_name in ...
初めに TensorFlowと言えばDeepLearningのためのフレームワーク...というだけではなく、実際のところ、TFはもっと色々な事が出来ます。 モデルの式を定義して、損失を定義して、...
初めに 「個々の施策が売り上げにどの程度影響しているか」「個々の媒体への出稿が流入数にどの程度影響しているか」など、時系列の説明変数を用いて時系列の被説明変数を説明したい場面は多々あると思います...
はじめに 文書においてある単語が出現したとき、その文章中に別の限られた単語が頻繁に出現する事を共起と言います。 文章中からその文章を特徴付ける単語を抽出し、特徴語同士の共起関係をネットワーク図に...
29 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.