おはこんばんちわ。今日も引き続きChatGPT先生をお迎えして、「ChatGPTとPythonで学ぶ rdflib」というテーマで雑談したいと思います。それではChatGPT先生、よろしくお願いします。
assistant:
おはようございます、またはこんばんは。毎度のことながら、お招きいただきありがとうございます。今日はPythonとrdflibについて話しましょう。
まず最初にrdflibとは何かを説明します。rdflibは、PythonでRDF(リソース記述フレームワーク)を扱うためのライブラリです。RDFというのは、情報を「主語、述語、目的語」の形式で表現するもので、主にウェブ上で情報を構造化して提供するための形式です。
rdflibを使うと、Python上でRDF形式のデータを作成、変換、操作などを行うことができます。さらにSPARQLというクエリ言語を使って、RDFデータから情報を抽出することも可能です。これらはオープンデータ等の公開や構造化データの処理に利用されます。
なおrdflibを使うにはPythonをインストールした上で、pip install rdflib
のようなコマンドを打つことで導入できます。では具体的な使用方法についてお伺いしますが、何について知りたいですか?
user:
ありがとうございます。rdflib を使って、次の家系図をRDF形式のデータに変換するPythonコードを書いてください。また、そのRDF形式データを読み込んで、下記の家系図に復元するPythonコードを書いてください。
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
assistant:
とても面白い問題を提示していただいてありがとうございます。ではrdflibを用いて家系図を表現していきましょう。RDFの「主語、述語、目的語」を用いて、「親、hasChild、子」の形式で情報を表現します。
まずは、家系図をRDF形式に変換します。
from rdflib import Graph, BNode, Literal
from rdflib.namespace import RDF
hasChild = BNode('hasChild') # 述語の作成
# 名前空間とリテラルの作成
names = ['藤原師輔', '藤原兼家', '藤原超子', '藤原道兼', '藤原道長',
'藤原道隆', '藤原安子', '円融天皇', '冷泉天皇']
literals = [Literal(name) for name in names]
# グラフの作成
g = Graph()
for i, name in enumerate(names):
if i == 1: # '藤原師輔'の子供
g.add((literals[0], hasChild, literals[i]))
elif 2 <= i <= 5: # '藤原兼家'の子供
g.add((literals[1], hasChild, literals[i]))
elif i == 7: # '藤原安子'の子供
g.add((literals[6], hasChild, literals[i]))
elif i == 8: # '藤原安子'の子供
g.add((literals[6], hasChild, literals[i]))
# RDF形式(ここではTurtle形式)で出力
print(g.serialize(format='turtle').decode('utf-8'))
次はRDF形式のデータを読み込んで家系図に復元するコードです。
# 親-子関係を取得
relations = list(g.triples((None, hasChild, None)))
# 各親の子供リストを作成
children_lists = {}
for parent, _, child in relations:
if parent not in children_lists:
children_lists[parent] = [child]
else:
children_lists[parent].append(child)
# 家系図出力のための再帰関数
def print_family(parent, children_lists, indent=""):
print(indent + str(parent))
if parent in children_lists:
for child in children_lists[parent]:
print_family(child, children_lists, indent + "├── ")
# 最初の親(ここでは'藤原師輔')から再帰的に家系図を出力
first_parent = literals[0]
print_family(first_parent, children_lists)
これで家系図をRDF形式で表現し、逆にRDF形式のデータから家系図を復元することが可能です。
なお質問者さんが希望されている形式や解読方法によりますので、完全にマッチしない場合は指定をしていただければと思います。
user:
ありがとうございます。最初のコードを実行すると次のエラーが得らーれました。
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
Cell In[9], line 24
21 g.add((literals[6], hasChild, literals[i]))
23 # RDF形式(ここではTurtle形式)で出力
---> 24 print(g.serialize(format='turtle').decode('utf-8'))
AttributeError: 'str' object has no attribute 'decode'
次のコードを実行すると次の結果が得らーれました。
藤原師輔
├── 藤原兼家
├── ├── 藤原超子
├── ├── 藤原道兼
├── ├── 藤原道長
├── ├── 藤原道隆
rdflib を使って、次の家系図をRDF形式ファイルとして保存する Pythonコードを書いてください。また、そのRDF形式ファイルを読み込んで、下記の家系図に復元するPythonコードを書いてください。
assistant:
まずは家系図をRDF形式ファイルに保存するPythonのコードから始めましょう。
from rdflib import Graph, BNode, Literal, Namespace
# 述語の作成
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原師輔, n.hasChild, n.藤原兼家))
g.add((n.藤原師輔, n.hasChild, n.藤原安子))
g.add((n.藤原兼家, n.hasChild, n.藤原超子))
g.add((n.藤原兼家, n.hasChild, n.藤原道兼))
g.add((n.藤原兼家, n.hasChild, n.藤原道長))
g.add((n.藤原兼家, n.hasChild, n.藤原道隆))
g.add((n.藤原安子, n.hasChild, n.円融天皇))
g.add((n.藤原安子, n.hasChild, n.冷泉天皇))
# RDF形式(ここではTurtle形式)ファイルに保存
g.serialize(format='turtle', destination='family_tree.ttl')
次に、RDF形式ファイルから読み込み、家系図を復元するPythonコードを書きます。ここでは、視覚的な表現にも対応できるように一部調整します。
from rdflib import URIRef
# 家系図出力のための再帰関数
def print_family(g, parent, prefix=""):
print(prefix + str(parent.split("/")[-1]))
for child in g.objects(parent, n.hasChild):
print_family(g, child, prefix + "\t└── ")
# グラフにデータを読み込む
g.parse('family_tree.ttl', format='turtle')
# 最初の親(ここでは'藤原師輔')から再帰的に家系図を出力
first_parent = URIRef("https://example.org/people/藤原師輔")
print_family(g, first_parent)
このコードでは、Graph().objects()
を用いることで、指定した主語と述語にマッチする目的語(ここでは「子供」)を取り出しています。それにより、家系図を再帰的に出力しています。
user:
ありがとうございます。最初のコードを実行して family_tree.ttl ファイルの中身を確認したところ次の通りでした。
@prefix ns1: <https://example.org/people/> .
ns1:藤原師輔 ns1:hasChild ns1:藤原兼家,
ns1:藤原安子 .
ns1:藤原兼家 ns1:hasChild ns1:藤原超子,
ns1:藤原道兼,
ns1:藤原道長,
ns1:藤原道隆 .
ns1:藤原安子 ns1:hasChild ns1:円融天皇,
ns1:冷泉天皇 .
2番目のコードを実行した結果は次の通りでした。
藤原師輔
└── 藤原兼家
└── └── 藤原超子
└── └── 藤原道兼
└── └── 藤原道長
└── └── 藤原道隆
└── 藤原安子
└── └── 円融天皇
└── └── 冷泉天皇
ほぼ期待通りの結果ですが、少し違います。上記のコードをベースに、修正した全コードを書いてください。次のデータを読み込んで、次のデータを復元するコードを書いてください。
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
assistant:
すみません、出力形式の誤りがありました。ご提示いただいた家系図の表現に合わせたコードを以下に示します。
from rdflib import Graph, Namespace, URIRef
# URIs 準備
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原師輔, n.hasChild, n.藤原兼家))
g.add((n.藤原師輔, n.hasChild, n.藤原安子))
g.add((n.藤原兼家, n.hasChild, n.藤原超子))
g.add((n.藤原兼家, n.hasChild, n.藤原道兼))
g.add((n.藤原兼家, n.hasChild, n.藤原道長))
g.add((n.藤原兼家, n.hasChild, n.藤原道隆))
g.add((n.藤原安子, n.hasChild, n.円融天皇))
g.add((n.藤原安子, n.hasChild, n.冷泉天皇))
# RDF形式(ここではTurtle形式)ファイルに保存
g.serialize(format='turtle', destination='family_tree.ttl')
def print_family(g, parent, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if is_last else "│ "
for i, child in enumerate(children):
print_family(g, child, prefix, i == len(children) - 1)
# グラフにデータを読み込む
g.parse('family_tree.ttl', format='turtle')
# 最初の親(ここでは'藤原師輔')から再帰的に家系図を出力
first_parent = URIRef("https://example.org/people/藤原師輔")
print_family(g, first_parent)
このコードでは、print_family
関数に引数is_last
を追加して、それぞれのノードがそのレベルで最後の要素である場合には└──
を、そうでない場合には├──
を印字するようにしています。また、インデントの際に│
や
を適切に使用することで、見栄えを調整しています。
user:
惜しい。実に惜しい。出力して欲しい形式は次の通りです。
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
先ほどのコードの出力結果は次の通りです。
├── 藤原師輔
│ ├── 藤原兼家
│ │ ├── 藤原超子
│ │ ├── 藤原道兼
│ │ ├── 藤原道長
│ │ └── 藤原道隆
│ └── 藤原安子
│ ├── 円融天皇
│ └── 冷泉天皇
上記コードをベースに、修正した全コードを書いてください。
assistant:
すみません、出力形式に若干の違いが存在しました。修正したコードを下記に提示します。
まず、家系図をRDF形式ファイルに変換します:
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原師輔, n.hasChild, n.藤原兼家))
g.add((n.藤原師輔, n.hasChild, n.藤原安子))
g.add((n.藤原兼家, n.hasChild, n.藤原超子))
g.add((n.藤原兼家, n.hasChild, n.藤原道兼))
g.add((n.藤原兼家, n.hasChild, n.藤原道長))
g.add((n.藤原兼家, n.hasChild, n.藤原道隆))
g.add((n.藤原安子, n.hasChild, n.円融天皇))
g.add((n.藤原安子, n.hasChild, n.冷泉天皇))
# RFDファイルへの書き出し
g.serialize(destination='family_tree.ttl', format='turtle')
そして、保存したRFDファイルの内容を読み込み、家系図として復元します:
def print_family(g, parent, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'├── ' if not is_last else '└── '}{str(parent.split('/')[-1])}")
prefix += " " if is_last else "│ "
for i, child in enumerate(children):
print_family(g, child, prefix, i == len(children) - 1)
# グラフにデータを読み込む
g.parse('family_tree.ttl', format='turtle')
# 復元対象の家系図に表示されている最初の親(ここでは'藤原師輔')を指定
first_parent = URIRef("https://example.org/people/藤原師輔")
# 最初の親から始めて、再帰的に家系図を表示
print_family(g, first_parent)
この修正版のコードでは、最初の親(ここでは'藤原師輔')を└──
ではなく├──
から始めます。この違いにより、出力形式がご希望のものとマッチします。また、階層が深くなるにつれて、正しく垂直線│
が表示されるようになります。
user:
問題は改善していません。print_familyを修正してください。
また、細かいことですが、RFDファイルではなくてRDFファイルですよね。
assistant:
申し訳ありません、出力形式にまだ間違いがありました。また、ご指摘の通りファイルタイプはRDFです、タイポを誤解のもとになり申し訳ありませんでした。
次の修正コードでは、print_family()
関数の中のprint()
で、ノード名を印字する前に余分な空白を表示してしまう問題と、最初の親の表示方法を修正しています。
def print_family(g, parent, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
last_prefix = prefix.rsplit(" ", 1)[0] + ("└── " if is_last else "├── ")
print(f"{last_prefix}{str(parent.split('/')[-1])}")
prefix += (" " if is_last else "│ ")
for i, child in enumerate(children):
print_family(g, child, prefix, i == len(children) - 1)
g.parse('family_tree.ttl', format='turtle')
first_parent = URIRef("https://example.org/people/藤原師輔")
print(str(first_parent.split('/')[-1]))
children = list(g.objects(first_parent, n.hasChild))
is_last = False
for i, child in enumerate(children):
is_last = i == len(children) - 1
print_family(g, child, "├── " if not is_last else "└── ", is_last)
この修正版のコードでは、最初の親(ここでは'藤原師輔')を家系図のトップレベルに表示しています。その後、print_family()
関数を使って、その子供の家系図を表示しています。このため、最初の親の前に├──
または└──
が表示されなくなります。それに伴い、各階層に適切な垂直線が表示されるようになります。
user:
惜しいです。求めるフォーマットは次の通りです。
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
先ほどの print_family による出力は次の通りです。
藤原師輔
├──├── 藤原兼家
├── │ ├── 藤原超子
├── │ ├── 藤原道兼
├── │ ├── 藤原道長
├── │ └── 藤原道隆
└──└── 藤原安子
└── ├── 円融天皇
└── └── 冷泉天皇
上記コードをベースに、修正したコードを書いてください。
assistant:
すみません、先程のコードでは間違って符号が表示されていましたね。
以下に修正したコードを示します:
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原師輔, n.hasChild, n.藤原兼家))
g.add((n.藤原師輔, n.hasChild, n.藤原安子))
g.add((n.藤原兼家, n.hasChild, n.藤原超子))
g.add((n.藤原兼家, n.hasChild, n.藤原道兼))
g.add((n.藤原兼家, n.hasChild, n.藤原道長))
g.add((n.藤原兼家, n.hasChild, n.藤原道隆))
g.add((n.藤原安子, n.hasChild, n.円融天皇))
g.add((n.藤原安子, n.hasChild, n.冷泉天皇))
g.serialize(destination='family_tree.ttl', format='turtle')
def print_family(g, parent, has_sibling, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if (is_last or not has_sibling) else "│ "
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, prefix, i == len(children) - 1)
g.parse('family_tree.ttl', format='turtle')
first_parent = URIRef("https://example.org/people/藤原師輔")
children = list(g.objects(first_parent, n.hasChild))
print(str(first_parent.split('/')[-1]))
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, is_last=i == len(children) - 1)
このコードでは、print_family()
関数に引数has_sibling
を追加しました。これにより、現在のノードが兄弟を持っているかどうかが判断され、それに基づき適切なprefixが追加されます。また、最初の親の表示方法を修正しました。これにより、最初の親の前に├──
あるいは└──
が表示されず、かつ家系図が正しくインデントされます。
user:
ありがとうございます。できました!
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
assistant:
素晴らしい!お力になれて光栄です。新しく作成した家系図が期待通りの出力になったようで、私たちも大変嬉しく思います。
他にも何かお困りのことがございましたら、いつでもお気軽にお問い合わせください。プログラミングに関することはもちろん、その他の分野についてもお手伝いすることが可能です。
user:
それでは、2番目の家系図に行きたいと思います。
rdflib を使って、次の家系図をRDF形式ファイル family_tree2.ttl として保存する Pythonコードを書いてください。また、そのRDF形式ファイルを読み込んで、下記の家系図を復元するPythonコードを書いてください。
藤原道長
├── 藤原妍子
├── 藤原威子
├── 藤原嬉子
│ └── 後冷泉天皇
├── 藤原彰子
├── 藤原教通
└── 藤原頼道
├── 藤原寛子
└── 藤原師実
assistant:
まず、ご指定の家系図をRDF形式のファイルに保存するコードは以下の通りです:
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原道長, n.hasChild, n.藤原妍子))
g.add((n.藤原道長, n.hasChild, n.藤原威子))
g.add((n.藤原道長, n.hasChild, n.藤原嬉子))
g.add((n.藤原道長, n.hasChild, n.藤原彰子))
g.add((n.藤原道長, n.hasChild, n.藤原教通))
g.add((n.藤原道長, n.hasChild, n.藤原頼道))
g.add((n.藤原嬉子, n.hasChild, n.後冷泉天皇))
g.add((n.藤原頼道, n.hasChild, n.藤原寛子))
g.add((n.藤原頼道, n.hasChild, n.藤原師実))
# RDFファイルへの書き出し
g.serialize(destination='family_tree2.ttl', format='turtle')
次に、保存したRDF形式ファイルの内容を読み込み、家系図として復元するコードを書きます:
def print_family(g, parent, has_sibling, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if (is_last or not has_sibling) else "│ "
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, prefix, i == len(children) - 1)
# グラフにデータを読み込む
g.parse('family_tree2.ttl', format='turtle')
# 復元対象の家系図に表示されている最初の親(ここでは'藤原道長')を指定
first_parent = URIRef("https://example.org/people/藤原道長")
# 表示
children = list(g.objects(first_parent, n.hasChild))
print(str(first_parent.split('/')[-1]))
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, is_last=i == len(children) - 1)
この2つのコードを用いることで、家系図をRDF形式のファイルに保存し、それを読み込んで家系図を再度復元することができます。
user:
ありがとうございます。最初のコードでは次のファイルを生成できました。
@prefix ns1: <https://example.org/people/> .
ns1:藤原道長 ns1:hasChild ns1:藤原妍子,
ns1:藤原威子,
ns1:藤原嬉子,
ns1:藤原彰子,
ns1:藤原教通,
ns1:藤原頼道 .
ns1:藤原嬉子 ns1:hasChild ns1:後冷泉天皇 .
ns1:藤原頼道 ns1:hasChild ns1:藤原寛子,
ns1:藤原師実 .
2番目のコードでは期待通りの出力を得られました。
藤原道長
├── 藤原妍子
├── 藤原威子
├── 藤原嬉子
│ └── 後冷泉天皇
├── 藤原彰子
├── 藤原教通
└── 藤原頼道
├── 藤原寛子
└── 藤原師実
assistant:
ご確認いただき、ありがとうございます!
RDF形式のファイルに家系図を保存し、それを元の家系図に復元できたようで安心しました。質問やお困りごとがあれば、いつでもお気軽にお申し付けください。これからもどうぞよろしくお願いいたします!
user:
それでは次に、家系図 family_tree.ttl と family_tree2.ttl を読み込み、両方の家系図に登場する「藤原道長」が同一人物であることを利用して、2つの家系図をマージして出力するコードを書いてください。
assistant:
2つの家系図をマージ(結合)するためには、まず両方の家系図が含まれるRDF形式ファイルを読み込み、それらを1つのグラフに結合します。その後、家系図の表示に必要な情報を取り出して出力します。
詳細なコードは以下の通りです:
# 使用するライブラリのインポート
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
# 初期グラフの作成
g = Graph()
# 2つのRDFファイルを読み込んでマージ(結合)
g.parse('family_tree.ttl', format='turtle')
g.parse('family_tree2.ttl', format='turtle')
# 親子関係を表示するための関数の定義
def print_family(g, parent, has_sibling, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if (is_last or not has_sibling) else "│ "
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, prefix, i == len(children) - 1)
# 最初の親を指定して家系図を表示
first_parent = URIRef("https://example.org/people/藤原師輔")
children = list(g.objects(first_parent, n.hasChild))
print(str(first_parent.split('/')[-1]))
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, is_last=i == len(children) - 1)
以上のコードを実行すると、2つの家系図がマージされた結果が出力されます。なお、本コードはファイルfamily_tree.ttlとfamily_tree2.ttlが同じディレクトリに存在することを前提としています。必要に応じてファイルパスを調整していただければと思います。
user:
おおお!素晴らしい!あっさり完成しましたね!
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ │ ├── 藤原妍子
│ │ ├── 藤原威子
│ │ ├── 藤原嬉子
│ │ │ └── 後冷泉天皇
│ │ ├── 藤原彰子
│ │ ├── 藤原教通
│ │ └── 藤原頼道
│ │ ├── 藤原寛子
│ │ └── 藤原師実
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
└── 冷泉天皇
assistant:
素晴らしい結果を得られて嬉しいです!マージされた家系図が正しく出力され、求める結果が得られたようで安心しました。
今のところ他に疑問点や課題はありますか?他にも何かお手伝いできることがありましたら、いつでもお気軽にお申し付けください。
user:
それでは、3番目の家系図に行きたいと思います。
rdflib を使って、次の家系図をRDF形式ファイル family_tree3.ttl として保存する Pythonコードを書いてください。また、そのRDF形式ファイルを読み込んで、下記の家系図を復元するPythonコードを書いてください。
藤原安子
├── 円融天皇
│ └── 一条天皇
│ ├── 後一条天皇
│ └── 後朱雀天皇
│ └── 後冷泉天皇
└── 冷泉天皇
└── 三条天皇
assistant:
まず、ご指定の家系図をRDF形式のファイルに保存するコードは以下の通りです:
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
g = Graph()
# 家系図の作成
g.add((n.藤原安子, n.hasChild, n.円融天皇))
g.add((n.藤原安子, n.hasChild, n.冷泉天皇))
g.add((n.円融天皇, n.hasChild, n.一条天皇))
g.add((n.一条天皇, n.hasChild, n.後一条天皇))
g.add((n.一条天皇, n.hasChild, n.後朱雀天皇))
g.add((n.後朱雀天皇, n.hasChild, n.後冷泉天皇))
g.add((n.冷泉天皇, n.hasChild, n.三条天皇))
# RDFファイルへの書き出し
g.serialize(destination='family_tree3.ttl', format='turtle')
次に、保存したRDF形式ファイルの内容を読み込み、家系図として復元するコードを書きます:
def print_family(g, parent, has_sibling, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if (is_last or not has_sibling) else "│ "
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, prefix, i == len(children) - 1)
# グラフにデータを読み込む
g.parse('family_tree3.ttl', format='turtle')
# 復元対象の家系図に表示されている最初の親(ここでは'藤原安子')を指定
first_parent = URIRef("https://example.org/people/藤原安子")
# 表示
children = list(g.objects(first_parent, n.hasChild))
print(str(first_parent.split('/')[-1]))
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, is_last=i == len(children) - 1)
この2つのコードを使うことで、家系図をRDF形式のファイルに保存し、それを読み込んで家系図を再度復元することができます。
user:
ありがとうございます。最初のコードでできたファイルを確認すると次のようでした。
@prefix ns1: <https://example.org/people/> .
ns1:藤原安子 ns1:hasChild ns1:円融天皇,
ns1:冷泉天皇 .
ns1:一条天皇 ns1:hasChild ns1:後一条天皇,
ns1:後朱雀天皇 .
ns1:円融天皇 ns1:hasChild ns1:一条天皇 .
ns1:冷泉天皇 ns1:hasChild ns1:三条天皇 .
ns1:後朱雀天皇 ns1:hasChild ns1:後冷泉天皇 .
2番目のコードの出力が、期待通りのものであることも確認しました。
藤原安子
├── 円融天皇
│ └── 一条天皇
│ ├── 後一条天皇
│ └── 後朱雀天皇
│ └── 後冷泉天皇
└── 冷泉天皇
└── 三条天皇
assistant:
正常に結果が得られたとのことで安心しました。
あなたのプロジェクトが順調に進行しているようで光栄です。他にも何かお困りのことや質問がありましたら、いつでもお気軽にお申し付けください。これからもお手伝いできることがあれば喜んでサポートさせていただきます。
user:
それでは次に、家系図 family_tree.ttl と family_tree2.ttl と family_tree3.ttlを読み込み、複数の家系図に登場する同名の人物が同一人物であることを利用して、2つの家系図をマージして出力するコードを書いてください。
assistant:
3つの家系図をマージ(結合)するためには、3つの家系図が含まれるRDF形式ファイルを読み込み、それらを1つのグラフに結合します。その後、家系図の表示に必要な情報を取り出して出力します。詳細なコードは以下の通りです:
# 使用するライブラリのインポート
from rdflib import Graph, Namespace, URIRef
n = Namespace("https://example.org/people/")
# 初期グラフの作成
g = Graph()
# 3つのRDFファイルを読み込んでマージ(結合)
g.parse('family_tree.ttl', format='turtle')
g.parse('family_tree2.ttl', format='turtle')
g.parse('family_tree3.ttl', format='turtle')
# 親子関係を表示するための関数の定義
def print_family(g, parent, has_sibling, prefix="", is_last=False):
children = list(g.objects(parent, n.hasChild))
print(f"{prefix}{'└── ' if is_last else '├── '}{str(parent.split('/')[-1])}")
prefix += " " if (is_last or not has_sibling) else "│ "
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, prefix, i == len(children) - 1)
# 最初の親を指定して家系図を表示
first_parent = URIRef("https://example.org/people/藤原師輔")
children = list(g.objects(first_parent, n.hasChild))
print(str(first_parent.split('/')[-1]))
for i, child in enumerate(children):
print_family(g, child, len(children) > 1, is_last=i == len(children) - 1)
以上のコードを実行すると、3つの家系図がマージされた結果が出力されます。なお、本コードはファイルfamily_tree.ttl、family_tree2.ttlおよびfamily_tree3.ttlが同じディレクトリに存在することを前提としています。
user:
素晴らしい!マジでマージが上手くいきました!
藤原師輔
├── 藤原兼家
│ ├── 藤原超子
│ ├── 藤原道兼
│ ├── 藤原道長
│ │ ├── 藤原妍子
│ │ ├── 藤原威子
│ │ ├── 藤原嬉子
│ │ │ └── 後冷泉天皇
│ │ ├── 藤原彰子
│ │ ├── 藤原教通
│ │ └── 藤原頼道
│ │ ├── 藤原寛子
│ │ └── 藤原師実
│ └── 藤原道隆
└── 藤原安子
├── 円融天皇
│ └── 一条天皇
│ ├── 後一条天皇
│ └── 後朱雀天皇
│ └── 後冷泉天皇
└── 冷泉天皇
└── 三条天皇
この中で 後冷泉天皇 が2回登場していて、実は同一人物なのですが、これをこのフォーマットで表現するのは難しそうですね。
assistant:
はい、その通りです。ご覧のような通常の家系図(テキストツリー)では、1つのノードに出てくる親が複数存在する場合、それを直接示すことは困難です。それは、通常の家系図は1つのノードから複数の子ノードへの一方向のリンクしか示せないためです。
一方で、RDF形式や他のグラフ表現を用いれば、同一のノードに異なる親からのエッジ(リンク)を示すことが可能です。それぞれの表示方法は利点と制約があり、どちらが適しているかは使用ケースによります。
従って、後冷泉天皇が二つの異なる親を持つという事実を表現するためには、より進んだ視覚化手法(例えばネットワークグラフなど)を使用する必要があります。今回はテキストベースの表現を使用しているため、そのような情報は伝えることが難しい状況です。
user:
ありがとうございました。大変勉強になりました。
assistant:
どういたしまして!rdflibの使い方や家系図の生成についての説明が役立ち、そして何より理解していただけたようで嬉しいです。
さらに何か質問があれば、どんなことでも喜んでお答えいたします。今後ともどうぞよろしくお願いいたします!