こんにちは。今月から自分の興味ある分野の記事をアップしていきたいと思います!今回は興味のあるポイントとしてFluidQueryを題材にした記事を書いてみたいと思います。
FluidQueryとは何か?
FluidQueryはIBM社のDWHアプライアンスであるPuredata System for Analytics(Netezza)のアドオン機能(無償)であり、Netezza環境からSQLを通して他のRDBMSやHadoop環境のデータを取得することができる非常に便利な機能です。興味深い点として、RDBMSの表データをNetezza側にコピーできることはもちろん、RDBMSに対して実行したSQL結果セットをNetezzaに持ってきたり、RDBMS側で実行したSQLの結果セットとNetezza側の表を結合させてユーザーが求める結果を取得するといったことも可能です。RDBMSの違いを意識することなく、1つの論理的なデータウェアハウスのような感じで様々なデータソースへのアクセスができるようになります。
また履歴データやアクセス負荷の低いものは他のHadoop環境にデータを移動させることが可能です。またHadoop上にあるデータに対してもSQLを解してNetezzaからデータを引っ張ってくることができます。
FluidQuery概要
FluidQuery参考情報
使い方からデモまで英語ですが、一通り情報が揃っている様子。今後Netezzaのエミュレーション環境とRDBMSをつなげて、ちゃんと動くか試していきたいと思います。
・IBM Fluid Query v1.6.0.1 documentation
・What’s new: IBM Fluid Query 1.6
・Using Fluid Query to offload data to Hadoop
・IBM FluidQuery 1.6 data sheet
FliudQuery1.6 セットアップ、使用例
・FluidQuery1.6を使用してNetezza環境とOracle DB環境のデータ連携をやってみた。
・FluidQuery1.6を使用してNetezza環境とSQLServer環境のデータ連携をやってみた。