1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

SPARQL + 推論 + RDFストリーミング + ML を1つに統合したRustエンジン

1
Posted at

私たちは、Rustで書かれた高性能・並列処理対応・機能豊富なSPARQLクエリエンジン Kolibrie を共有できることを嬉しく思います。Kolibrieは、大規模なRDFデータセットに対しても高速かつスケーラブルに動作するように設計されています。

今回のリリースでは、CLIに加えて WebUI を追加したため、使いやすさが大きく向上しました。より簡単に試してみたり、動作を確認したりできます。

主な機能:
• SPARQLクエリ実行
• ルールベース推論
• RDFストリーミング処理
• MLオペレータ(ML.PREDICT-style):独自のMLモデルを持ち込めます。現在はPyO3経由ですが、将来的にはよりRustネイティブなMLパスとして candle の利用も検討しています ;)
• Pythonサポート
• オプティマイザ改善 + 多数のパフォーマンス改善

また比較実験も行いました(クエリ性能は WatDiv(10M triples)、推論は deep taxonomy を使用)。現時点のワークロードでは、Kolibrieは Apache Jena、EYE、Oxigraph、Blazegraph、QLever といったエンジンと比較して非常に良い性能を示しています。
補足として、Virtuoso や GraphDB のような業界向けエンジンとはベンチマーク比較していません。理由の一つはライセンスで、これらは通常 無償版(コミュニティ版) と 商用版(エンタープライズ版) に分かれており、「本番向けの機能/性能」が商用版に含まれることが多く、公平な比較が難しいためです。無償版は意図的に機能や性能が制限されている場合もあります。そのため今回は、よりオープンソースで評価/再現がしやすいエンジンを中心に比較しました。

P.S. もしこのプロジェクトに興味を持っていただけたら、GitHubでスターを付けていただけるととても助かります :)
またDiscordコミュニティもあり、アカデミア/産業界どちらのコラボも歓迎です。コード、ドキュメント、ベンチマーク、Issueなど、どんな形でもコントリビュート大歓迎です。

研究背景については、こちらの Library に論文をまとめています。

GitHub Repo | Our Website | Discord

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?