JavaScirpt
シェルスクリプト

コンピューターずぶの素人がORACLE PGXを使ってみた①

More than 1 year has passed since last update.

まず初めに


  • 大学でコンピューターを使わない生物の勉強ばかりしてきたので完全に未経験
  • 将来SEになりたいために自分の研究として利用しようと決意

なので生暖かい目で見てください・・・

ORACLE PGXとは? ―データベース管理に用いられるグラフ分析エンジン


そもそもORACLE PGXとはなんなのか。もちろん生物分野(Network Biology)で使えるから使うわけだけど、、

 データベース管理という点で、SQLというクエリ言語が1970年代から発展してきた(最初にできたsystem Rに実装された言語であるSEQUEL (Structured English Query Language)からとった文字らしい?)。しかしこれはデータを表として扱っていることに長けているみたいです。
 しかし、生物はとてつもなく複雑な「ネットワーク」を持っていて、SQLで大量のデータを分析するのには限界があり(例:ネットワークに向きがあったり!)、バイオインフォマティクスのような学問が生まれてきたみたいです。自分の研究室では遺伝子やたんぱく質を「ノード」、そのつながりを「エッジ」として捉えて、グラフとしての解析が求められています。

てことで、そのさなかにたまたま機会がありORACLE PGXを知ることに・・・

OLACLE PGXは、プロパティ・グラフ形式でデータを格納するらしいのでその分SQLなんかよりも表現力が柔軟で直感的なクエリ言語(PGQLという言語でSQLライク)で検索可能だそう。その中で、Network Biologyにおいて重要な「つながり」を用いたアルゴリズムが使えるそう。

(どういうこと・・・?って最初はなりましたが(今も))

「使えるんじゃない?」ということで始めてみます!

もっと詳しく知りたい人は
- Oracle Labs PGX: Parallel Graph AnalytiX Overview

を見てどうぞ