More than 1 year has passed since last update.

Oracle Graph Advent Calendar 2021

Always Free 環境で SPARQL エンドポイントを構築！（WebLogic 編）

Last updated at 2022-11-09Posted at 2021-12-30

この記事では Oracle Cloud の Always Free Cloud Services を利用して SPARQL エンドポイントを構築する方法を紹介します。こちらは期間の制限なく無料で使用できるサービスで、1 アカウントあたり 2 つのデータベース・インスタンスと 2 つの VM が含まれています。

LOD（Linked Open Data）の公開のためには、そのデータを含む SPARQL エンドポイントが常にアクセス可能になっていることが望ましいのですが、SPARQL エンドポイントとそのバックエンドの RDF ストアをウェブ上で運用するには通常なんらかのコストがかかってしまいます。しかし、Oracle Cloud を使えば無料でこれを運用（＊）することができます！

＊ただし、その用途は個人利用やテスト目的に限られることにご注意ください。Always Free Cloud Services は SLA とサポートの対象外であり、エンドポイント管理サーバーが使用している WebLogic には OTN ライセンスが適用されますので、商用本番利用においては有償のサービスをご検討ください。

ここではエンドポイント管理サーバーを構築して SPARQL クエリを実行するまでの、最も簡略化した手順を記載します。その他に考慮すべき点についてはこの記事の末尾に参考として記載します。

準備

まず、以下を用意しておきます。パスワードは同じものを使用することも可能です。

Oracle Cloud のアカウント
SSH key pair (private と public key)
3 つのパスワード
- <password_1>: DB ログイン用（ADMIN user）
- <password_2>: RDF Server ログイン用（admin user）
- <password_3>: DB 接続 Wallet 用

データベースの作成

次のように画面を進み、データベースを作成します。このデータベースは Autonomous Database と呼ばれるフル・マネージド・サービスです。

Oracle Cloud console
  > Oracle Database
    > Autonomous Database
      > Create Autonomous Database

Configure the database
- Database name: <db_name> （ここでは ADB1 とします）
- Workload type: トランザクション処理
- Deployment type: 共有インフラストラクチャ
- Database version: 19c or 21c
- Password: <password_1>

ネットワークの作成

次のように画面を進み、SPARQL エンドポイント用のネットワークを作成します。Oracle Cloud のネットワークは詳細に設定が可能ですが、ウィザードを使うことで基本的な構成を簡単に作成できるため、今回はそれを使用します。

Oracle Cloud console
  > Networking
    > Virtual Cloud Networks
      > Start VCN Wizard
        > Create VCN with Internet Connectivity
          > Start VCN Wizard

Configuration
- VCN NAME:（ここでは VCN1 とします）
- その他の項目: 変更の必要なし

VCN1 に作成されたパブリック・サブネットに対して次のルールを新しく追加して、7002 ポートと 8001 ポートを外部からアクセス可能にします。

Oracle Cloud console
  > Networking
    > Virtual Cloud Networks
      > VCN1
        > Public Subnet-VCN1
          > Default Security List for VCN1
            > Add Ingress Rules

Add Ingress Rules
- Source CIDR: 0.0.0.0/0
- Destination port range: 7002,8001
- Description: For SPARQL Endpoint

エンドポイント管理サーバーの作成

エンドポイント管理サーバー（RDF Graph Server and Query UI）は、マーケットプレイス・イメージとして配布されているので、次のように画面を進み、このイメージからインスタンスを作成します。

Oracle Cloud console
  > Marketplace
    > All Applications

Image
- Name: Oracle RDF Graph Server and Query UI
- Version: 22.2.0

Configure Variables
- Resource name prefix: 任意の名前
- OCI compartment: お使いのコンパートメント
- Server available domain: 任意のドメイン
- Server shape: VM.Standard.E2.1.Micro（Always Free で使用可）
Add SSH keys
- SSH public key: 公開鍵 (e.g. ssh-rsa AAAAB3NzaC...)
Instance Network
- Virtual cloud network compartment: お使いのコンパートメント
- Existing virtual cloud network: 上で作成された VCN
- Subnet compartment: お使いのコンパートメント
- Existing subnet: 上で作成された VCN の public subnet
WebLogic Advanced Configuration
- WebLogic Admin User Name: admin
- WebLogic Admin Password: <password_2>

インスタンスの作成には数分かかります。

作成完了後、ログ出力に新しいインスタンスの IP アドレスが表示されるので、これを控えておいてください。IP アドレスは後からコンピュート・インスタンスのページで確認することもできます。

エンドポイント管理サーバーへのログイン

作成されたエンドポイント管理サーバーにアクセスします。

URL: https://<ip_address>:8001/orardf

自己署名証明書が使われているため、セキュリティ警告が表示されます。

Chrome: "thisisunsafe" とタイプします
Firefox: Advanced > Accept the Risk and continue

デフォルトのパスワードでログインします。

User: admin
Password: <password_2>

ログインできましたが、この時点ではエンドポイント管理サーバーは Autonomous Database に接続されていないため、クエリ対象となるデータソースはありません。

Wallet のダウンロード

この SPARQL エンドポイントから Autonomous Database にアクセスするためには Oracle Wallet を用いる必要があります。Oracle Wallet とは証明書、証明書要求、秘密鍵などの資格情報を格納するファイルをまとめた Zip ファイルです。

次のように画面を進んで、Wallet のダウンロードのページを開きます。

Oracle Cloud console
  > Oracle Database
    > Autonomous Database
      > Select the ADB created above
        > DB Connection

Wallet Type: Instance Wallet
Password: <password_3>

Wallet への資格証明の追加

SPARQL エンドポイントがこの Wallet を用いて Autonomous Database にアクセスするために、この Wallet に資格証明を含める必要があります。ここでは、一度、Wallet をインスタンスにアップロードして、以下のコマンドを用いて Wallet にユーザー名とパスワードを追加します。

$ scp -i <key> ~/Downloads/Wallet_<db_name>.zip opc@<ip_address>:
$ ssh -i <key> opc@<ip_address>
$ mkdir wallet
$ cd wallet
$ unzip ../Wallet_<db_name>.zip
$ export JAVA_HOME=/usr/local/java/jdk1.8.0_221
$ /u01/app/oracle/middleware/wls12214/oracle_common/bin/mkstore
  -wrl /home/opc/wallet -createCredential <db_name>_high ADMIN <password_1>

Enter wallet password: <password_3>

<...> の部分を置き換えた場合の例：

$ scp -i .ssh/id_rsa ~/Downloads/Wallet_ADB1.zip opc@192.0.2.1:
$ ssh -i .ssh/id_rsa opc@192.0.2.1
$ mkdir wallet
$ cd wallet
$ unzip ../Wallet_ADB1.zip
$ export JAVA_HOME=/usr/local/java/jdk1.8.0_221
$ /u01/app/oracle/middleware/wls12214/oracle_common/bin/mkstore \
  -wrl /home/opc/wallet -createCredential adb1_high ADMIN <password_1>

Enter wallet password: <password_3>

変更後の Wallet をダウンロードします。

$ zip ../wallet_with_cred.zip *
$ exit
$ scp -i <key> opc@<ip_address>:~/wallet_with_cred.zip ~/Downloads/

<...> の部分を置き換えた場合の例：

$ zip ../wallet_with_cred.zip *
$ exit
$ scp -i .ssh/id_rsa opc@192.0.2.1:~/wallet_with_cred.zip ~/Downloads/

データベースへの接続

エンドポイント管理サーバーの設定画面の Data sources タブからデータベースへの接続を作成して、Wallet をアップロードします。

Zip file: wallet_with_cred.zip を選択
Name: 任意のデータソース名 (e.g. ADB1)
Wallet Service: 上で Wallet に追加したサービス (e.g. adb1_high)

データソースが作成されると「Data」タブでこれを選択することができます。ただし、このデータソースにはまだ RDF network がありません。

RDF データのアップロード

ここでは、W3C のサイト（https://www.w3.org/TR/turtle/）に掲載されている次のサンプル・データをロードしてみます。

example1.ttl

@base <http://example.org/> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rel: <http://www.perceive.net/schemas/relationship/> .

<#green-goblin>
    rel:enemyOf <#spiderman> ;
    a foaf:Person ;    # in the context of the Marvel universe
    foaf:name "Green Goblin" .

<#spiderman>
    rel:enemyOf <#green-goblin> ;
    a foaf:Person ;
    foaf:name "Spiderman", "Человек-паук"@ru .

Data タブで先に登録したデータ・ソース (e.g. ADB1) を選択して、ここに RDF Network を作成します。ここで、Oracle Database における RDF Network とは、表や索引のセットからなる論理的な RDF ストアのことで、データベース上には RDF Network を複数作成することができます。

Network owner: ADMIN
Network name: 任意の RDF Network 名 (e.g. NETWORK1)
Tablespace: DATA

Data タブで先に作成した RDF Network (e.g. ADMIN.NETWORK1) を指定し、Import タブの Upload data アイコンをクリックして、ファイルをステージング表にアップロードします。

Upload: example1.ttl
Staging table: 任意の表名 (e.g. EXAMPLE1_TABLE)
Overwrite: false (既存の表を使いたい場合には上書きしても OK)

最後に、Import タブの Bulk load data アイコンをクリックして、ステージング表のデータを Model にロードします。ここで、Oracle Graph における Model とは、RDF Network 内のトリプルの集合の管理単位のことで、SPARQL クエリの対象として Model を指定したり、Model を束ねた Virtual Model を定義するといったことが可能です。

RDF Data
- Model: 任意のモデル名 (e.g. EXAMPLE1_MODEL)
- Staging table owner: ADMIN
- Staging table: 上で作成したステージング表 (e.g. EXAMPLE1_TABLE)
Options
- 全ての項目: 変更不要
Event Trace
- 全ての項目: 変更不要

SPARQL クエリの実行

まずは、エンドポイント管理サーバーのクエリ UI 上で SPARQL クエリを実行してみます。

クエリ対象のモデル（ここでは EXAMPLE1_MODEL）を右クリックし「Open」からエディタを開きます。

Execute ボタンをクリックして、デフォルトで入力されている SPARQL クエリを実行してみると、結果として格納されているトリプルが表示されます。

こちらは、Spiderman という名前のヒーロー（変数 ?h）の敵（?e）の名前（?e_name）を検索するクエリです。

PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rel: <http://www.perceive.net/schemas/relationship/>

SELECT ?e_name
WHERE {
  ?h foaf:name "Spiderman" .
  ?e rel:enemyOf ?h .
  ?e foaf:name ?e_name .
} 
LIMIT 500

Green Goblin が返されました！

エンドポイントの公開

この時点では、SPARQL エンドポイントはまだ公開されていません。エンドポイントの公開を可能するために、まず設定画面からこれを許可してデータ・ソース（ここでは ADB1）を選択します。

公開するモデルを右クリックして Publish を選択します。エンドポイント URL に使用するデータセットの名前（ここでは example1）を入力します。

以下のようなエンドポイント URL が表示されるのでこれを保存しておきます。

https://<ip_address>:8001/orardf/api/v1/datasets/query/published/example1

REST でエンドポイントにアクセス

GET もしくは POST を使ってエンドポイントに対して SPARQL クエリを発行してみます。まず、上でも用いた SPARQL クエリをファイルに保存しておきます。

sparql.rq

PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rel: <http://www.perceive.net/schemas/relationship/>

SELECT ?e_name
WHERE {
  ?h foaf:name "Spiderman" .
  ?e rel:enemyOf ?h .
  ?e foaf:name ?e_name .
} 
LIMIT 500

このファイルを指定して POST リクエストを実行します。ここでは自己署名証明書を使っているため --insecure オプションを指定してこれを許可しています。

$ curl https://<ip_address>:8001/orardf/api/v1/datasets/query/published/example1 \
  --data-binary @sparql.rq --insecure -X POST

結果はデフォルトでは W3C 標準の JSON 形式で返されます。

{
  "head": {
    "vars": [
      "E_NAME"
    ],
    "links": []
  },
  "results": {
    "bindings": [
      {
        "E_NAME": {
          "type": "literal",
          "value": "Green Goblin"
        }
      }
    ]
  }
}

参考：エンドポイントのパスワード変更

WebLogic Server コンソールにアクセスします。まだ証明書を設定していないので（自己署名証明書を使っているため）ウェブ・ブラウザの警告が出ます。Chrome では「thisisunsafe」の入力、Firefox では警告を承諾して次に進みます。

https://<ip_address>:7002/console

デフォルトのパスワードでログインします。

Username: admin
Password: <password_2>

Security Realms > myrealm > Users and Groups と進み、admin を選択します。

Passwords タブからパスワードを変更します。

参考：データ・ロード時にグラフ名を指定

RDF データをロードする際に、それらのトリプルのグラフ名を一括して設定し、クアッドとしてロードしたい場合があります。その場合には、トリプルをステージング表にアップロードした後に、その表にグラフ名を追加したビューを作成して、これを RDF モデルにロードします。

まず、Create RDF Network で説明しているとおりに、データをステージング表にアップロードします。

Upload: example1.ttl
Staging table: 任意の表名 (e.g. EXAMPLE1_TABLE)
Overwrite: false (既存の表を使いたい場合には上書きしても OK)

SQL を実行するため Database Actions を開きます。

Oracle Cloud console
  > Oracle Database
    > Autonomous Database
      > 作成した ADB を選択
        > Tools
          > Open Database Actions

次の SQL クエリを実行してビューを作成します。この際、指定したいグラフ名で <http://example.org/graph1> を置き換えてください。

create view SAMPLE_VIEW as
select
  RDF$STC_SUB
, RDF$STC_PRED
, RDF$STC_OBJ
, '<http://example.org/graph1>' as RDF$STC_GRAPH
from SAMPLE_TABLE

SPARQL エンドポイントに戻り、Import タブの Bulk load data アイコンをクリックして、作成したビューから新しいモデルへとデータをロードします。

RDF Data
- Model: 任意のモデル名 (e.g. EXAMPLE1_MODEL)
- Staging table owner: ADMIN
- Staging table: 上で作成したステージング表 (e.g. EXAMPLE1_VIEW)
Options
- 全ての項目: 変更不要
Event Trace
- 全ての項目: 変更不要

次の SPARQL クエリでグラフ名が結果に含まれることを確認できます。

SELECT *
WHERE { GRAPH ?g { ?s ?p ?o }} 
LIMIT 500

※ 冒頭画像 Photo by Cristian Escobar on Unsplash

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up