aiacademy.jp/media/?p=1184
BigQuery(ビッグクエリ)は、Googleのクラウド側データベースで、Google Cloud Platform(GCP)にて提供されています。 数テラバイトや数ペタバイトというビッグデータ出会っても、超高速で解析することができるのが特徴です。
bigdata-navi.com/aidrops/6148/
BigQueryには、以下のような特徴があります。
•データ処理が高速
•専門知識がなくても扱いやすい
•GA4と連携可能
BigQueryのデータ処理が高速な理由として、以下の2つの仕組みが挙げられます。
•カラム型データストアの採用
•ツリーアーキテクチャによる分散処理
domo.com/jp/glossary/wh…
データパイプラインとは、複数のソースからデータを収集、分析し、データを理解しやすい形で提示するために使用するプロセスとツールのことを指します
データパイプラインとETLの違い
•ETLは常にデータ変換を伴いますが、データサイエンスパイプラインは伴いません。
•データパイプラインは通常リアルタイムで実行されるのに対し、ETLはある程度のデータが溜まったタイミングや定期的なスケジュールでデータを転送します。
•ETLは、データがデータウェアハウスやデータベースにロードされた時点で停止します。データパイプラインはこれを過ぎても継続し、多くの場合、追加のフローやプロセスを起動させます。