はじめに
Teradata製品を全く知らなったころから約4年、Teradataを利用したデータ活用基盤のPJを進める上で得た知識を記事にします。
Teradata社とは
データウェアハウスを主軸としたデータ分析などの製品および関連サービスを販売している国際的なコンピュータ企業
会社概要
会社名 | Teradata Corporation(米国) |
---|---|
設立 | 1979年 |
本社 | 米国カリフォルニア州サンディエゴ |
事業展開 | 75か国以上 |
パートナー | 100社以上 |
お客様企業 | 1400社以上 |
日本法人 | 2007年設立 |
事業内容
信頼できるAIでビジネス成果を獲得するための、最も包括的なAI向け機能を搭載するクラウドデータ分析基盤「Teradata VantageCloud」の提供、およびAI、データを活用するためのコンサルティング、各種サービスの提供
製品の特長
エンタープライズレベルのパフォーマンスとスケーラビリティを超並列処理技術により実現するデータウェアハウス製品
詳細は以下のサイト
https://www.teradata.jp/press-releases/2018/teradata-vantage-the-platform-for-pervasive
製品ラインナップ
1. VantageCore(オンプレミス)
1.1 VantageCore IntelliFlex
SUSE Linux Enterprise Server(SLES)オペレーティング システムとTeradata Vantageが搭載されたアプライアンス製品
1.2 VantageCore vmware
SUSE Linux Enterprise Server(SLES)オペレーティング システムとTeradata Vantageが、サードパーティのハードウェア上の仮想化環境で実行される仮想コンテナにパッケージ化された製品
2.VantageCloud(クラウド)
2.1 VantageCloud Enterprise
オンプレミスの設計思想をクラウドに移行したSaaS製品
Autoscalingなど一部のクラウド機能も利用
※以前はMarketPlace上にDIY版がありましたが、2024年現在はDIYの販売を終了している
2.2 VantageCloud Lake
Enterpriseの機能も残しつつ、クラウドネイティブをベースとしたオブジェクトストレージにデータ管理とAutosclingを利用したコンピュートリソース(クラスタ)を提供
アーキテクチャ
■ VantageCore IntelliFlex / VantageCore vmware / VantageCloud Enterprise
プロセス名 | 説明 |
---|---|
PE | セッション制御、構文解析/最適化、各AMPに実行依頼 ・1プロセスあたり最大120セッション ・1サーバあたり2プロセス 1つのサーバあたり最大240セッションとなる |
AMP | 仮想プロセッサ(vproc) ・ 各ノードに複数配置・担当ディスクを有し、問合せに基づいてディスクにアクセス(配置、検索) ・データはAMP配下のディスクにハッシュ分散により分散/格納 ・1サーバあたり最大24AMP利用可能 |
BYNET | 高速なインターコネクト AMP間のデータをマージする機能を提供する |
----簡単に言うと
コンピュートとディスクがセットとなっている。
データを複数台のサーバ、複数のディスクに分散配置して管理している。
ディスク単位に1つの専用AMPが割り当てられており、それぞれのAMPが同時にデータの抽出/更新が可能であるため、高速化を実現している。
■ VantageCloud Lake
機能名 | 説明 |
---|---|
Session Manager | クライアントからのリクエストを受け付けるプロセス |
PrimaryCluster | Session Managerからリクエストに対して実行計画を送信、結果セットを受ける機能 ※PrimaryClusterおよびPrimaryクラスタ上のディスクを利用することでVantageCloud Enterpriseと同様の処理性能を実現することも可能 |
Compute Cluster | 必要に応じて拡張/縮小が可能なコンピューティングリソース |
Managed Storage | オブジェクトストレージ Teradata社管理のストレージ |
--簡単に言うと
VantageCloud Enterpriseとは異なり、コンピュートとディスクが完全に分離している
Managed Storage(オブジェクトストレージ)を利用したデータの管理する
主にCompute Clusterを起動し、データ取得/更新を行う。
Compute Clusterはクラウドが提供するautoscaling機能を利用することでコンピューティングリソース数の増減が可能
第2回-構築について
私はクラウドのVantageCould Enterpriseしか構築に携わっていないので
VantageCould Enterpriseの構築について次の記事で書きます。
※1から学ぶ「Teradata」(第2回)- VantageCould Enterprise構築編
https://qiita.com/NTTD-niwats/items/bdfe7510be76fd31648d
仲間募集
NTTデータ テクノロジーコンサルティング事業本部 では、以下の職種を募集しています。