私たちは、Rustで書かれた高性能・並列処理対応・機能豊富なSPARQLクエリエンジン Kolibrie を共有できることを嬉しく思います。Kolibrieは、大規模なRDFデータセットに対しても高速かつスケーラブルに動作するように設計されています。
今回のリリースでは、CLIに加えて WebUI を追加したため、使いやすさが大きく向上しました。より簡単に試してみたり、動作を確認したりできます。
主な機能:
• SPARQLクエリ実行
• ルールベース推論
• RDFストリーミング処理
• MLオペレータ(ML.PREDICT-style):独自のMLモデルを持ち込めます。現在はPyO3経由ですが、将来的にはよりRustネイティブなMLパスとして candle の利用も検討しています ;)
• Pythonサポート
• オプティマイザ改善 + 多数のパフォーマンス改善
また比較実験も行いました(クエリ性能は WatDiv(10M triples)、推論は deep taxonomy を使用)。現時点のワークロードでは、Kolibrieは Apache Jena、EYE、Oxigraph、Blazegraph、QLever といったエンジンと比較して非常に良い性能を示しています。
補足として、Virtuoso や GraphDB のような業界向けエンジンとはベンチマーク比較していません。理由の一つはライセンスで、これらは通常 無償版(コミュニティ版) と 商用版(エンタープライズ版) に分かれており、「本番向けの機能/性能」が商用版に含まれることが多く、公平な比較が難しいためです。無償版は意図的に機能や性能が制限されている場合もあります。そのため今回は、よりオープンソースで評価/再現がしやすいエンジンを中心に比較しました。
P.S. もしこのプロジェクトに興味を持っていただけたら、GitHubでスターを付けていただけるととても助かります :)
またDiscordコミュニティもあり、アカデミア/産業界どちらのコラボも歓迎です。コード、ドキュメント、ベンチマーク、Issueなど、どんな形でもコントリビュート大歓迎です。
研究背景については、こちらの Library に論文をまとめています。