はじめに
こんにちは、推薦研究ブロック新卒1年目、MLエンジニアの小倉です。
普段は商品詳細面の推薦システムの開発・運用を担当しています。
本題ですが、2025年8月に開催されたタイ・バンコクで開催された国際会議、DEXA(International Conference on Database and Expert Systems Applications)2025に参加してきました。
参加レポートとして、現地の様子や発表内容・参加した感想を紹介します。
私が発表してきた論文は「Efficient Source Selection for Federated SPARQL Queries Using Adjacent Predicate Information」です。
RDF(知識グラフ)の検索高速化の研究です。興味があれば読んでみてください。
DEXAとは
DEXAは1990年以来、データベース、データ統合、高度なデータ分析、そして知識システムにおける最先端の研究活動を紹介する年次国際会議です。トップ会議ではありませんがそれなりくらいの難易度の会議になってます。
DEXAは元々、データベースやデータ統合など、データの管理技術を中心とした専門的な会議でした。
しかし、近年のビッグデータやAI技術の急速な発展に伴い、現在ではそれらの新しい分野も積極的に取り込み、AIを活用した高度なデータ分析やその応用までを幅広く議論する、より総合的な会議になってきています。
開催地のタイ・バンコクについて
タイの首都バンコクは、都会の賑わいと厳かな仏教文化が息づき、古今の歴史と文化が調和した都市です。(Gemini)
「クルンテープ(天使の都)」という正式名称を持ち、その名の通り訪れる人々を魅了する多様な顔を持っています。(Gemini)
とにかく車と原付が多かったです。水道水が飲めません。
学会のスケジュール
- 1日目
- Opening Session
- Keynote Talk
- Industrial Talk
- Paper Presentations Session
- Welcome Reception
- 2日目
- Invited Talk
- Paper Presentations Session
- Banquet
- 3日目
- Tutorial
- Paper Presentations Session
印象に残った発表
ここからは私の印象に残った発表を紹介します。
私の興味のあるMLや推薦に関する発表について紹介します。
Sparse Matrix Algorithms for Evolving Neural Networks
Carlos Ordonez
Department of Computer Science, University of Houston, USA
現在のAIシステムは、データが巨大化し続けている一方で、そのデータの大部分がゼロ値(スパース)であるという特徴があります。例えば、SNSのユーザー間のつながりや、商品の購買履歴などは、可能な組み合わせのごく一部しか実際のデータとして存在しません。さらに、これらのデータは頻繁に更新され、新しいユーザーや商品、取引などが絶えず追加・削除されています。従来の手法では、このような大規模で動的なデータをメモリに収めきれなかったり、更新のたびに全体を再計算する必要があるなど、計算効率が非常に悪くなっています。
Ordonez氏が提案していたのは、データベース技術の考え方をニューラルネットワークの計算に応用することです。具体的には、座標タプル形式という、データベースでよく使われる保存方法を採用します。これは、Excelの表で例えると、すべてのセルを保存するのではなく、値が入っているセルの位置と値だけを記録する方法です。この方式により、ゼロでない値だけを効率的に保存でき、データの追加や削除も簡単に行えるようになります。
この提案が重要な理由は、現実世界の多くのAIアプリケーションが、まさにこのような動的で大規模なスパースデータを扱っているからです。金融取引の異常検知システムでは取引データがリアルタイムで更新されますし、医療診断AIでは新しい患者データが日々追加されます。推薦システムでは、ユーザーの行動履歴が常に変化しています。これらのシステムで、提案手法を使えば、メモリ不足を回避しながら、データの更新に応じて効率的にAIモデルを再学習できるようになります。
この研究が進めば、実際のAI開発の現場で大きなメリットが期待できると感じました。推薦システムであれば、ユーザーの行動が即座にモデルに反映され、リアルタイムでより精度の高いサービスが実現可能になると考えられます。さらに、高価な大容量メモリサーバーへの依存を減らせることから、運用コストの大幅削減も見込まれます。これは特に、リソースが限られている中小企業やスタートアップにとって、高度なAIシステムを導入する際の大きな後押しになると考えられます。
推薦システムの学習を効率化すれば、ユーザー行動を即座にモデルへ反映でき、リアルタイムで精度の高いサービスが実現します。
Food Recommendation With Balancing Comfort and Curiosity
Yuto Sakai and Qiang Ma
Kyoto University
こちらは日本からの発表でした。
従来の推薦システムは、ユーザーが好きそうなものを提案することはできますが、この「冒険心」と「安心感」という相反する要素のバランスを考慮することができないという問題に着目し、この問題を解決するための新しいアプローチを提案しています。著者らは、快適さと好奇心を数値化する2つの革新的な手法を開発しました。
カーネル密度スコアリング(KDS)は、統計学で使われるカーネル密度推定という技術を応用したものです。この手法では、ユーザーの過去の食事履歴を確率分布として表現します。簡単に言えば、今まで食べたことのある料理を中心に「なじみのある領域」を作り、そこからの距離で新しい料理の快適さや好奇心を測定するのです。例えば、ラーメンやうどんをよく食べる人にとって、ベトナムのフォーは比較的なじみのある領域に近く、一方でフランスのエスカルゴは遠く離れた未知の領域に位置することになります。
マハラノビス距離スコアリング(MDS)は、より洗練された統計的手法で、データの分散や相関を考慮した距離の測り方で、単純な距離とは異なり、データの分布の形状を反映します。食品推薦の文脈では、ユーザーの好みの「偏り」や「ばらつき」を考慮できます。例えば、ある人が辛い料理については幅広く挑戦的だが、甘い料理については保守的である場合、この個人差を適切に反映した推薦が可能になります。
MDSベースの手法は、快適さと好奇心をバランスさせるための食品推薦において、すべてのケースでKDSベースの手法およびベースラインよりも優れた性能を示したそうです。
この手法をZOZOの推薦システムに適用すると以下のような効果が得られる可能性があります。
- 顧客の飽き防止による長期定着: 常にユーザーの好みに合ったアイテムばかりを推薦することで生じる「飽き」を防ぐ。
- ロングテール商品の収益化: 埋もれがちな良質商品や季節外れ在庫など、通常では露出機会の少ない商品を適切なユーザーにマッチングすることで、在庫回転率を向上。
推薦チームでも商品推薦の多様性を高めていきたいと考えているので、この手法が一つの選択肢になるのかもしれません。
Local-aware Convolutional Modulation for Short-Term Sequential Recommendation
Tianxing Wang, Can Wang, Hui Tian & Hong Shen
Griffith University, Gold Coast, 4215, Australia
近年の推薦システムでは、ユーザーの行動履歴(例:閲覧した商品の順序)から次に興味を持ちそうなアイテムを予測する「逐次推薦」が重要になっています。これまでは主にTransformerなどが使われてきましたが、この研究ではCNNの可能性を再評価しています。
Transformerには重要な課題があります。まず計算コストの問題があり、大規模なシステムでは処理速度がボトルネックになりがちです。また、self-attentionは系列全体の関係性を捉えることには優れていますが、隣接する要素間の局所的な関係性を捉えることが必ずしも得意ではありません。
一方、CNNは、これらの課題に対して明確な利点を持っています。CNNは本質的に局所的なパターン認識に優れており、近接したアイテム間の関係を効率的に捉えることができます。さらに、計算効率の面でも優れており、大規模なシステムにおいてもスケーラブルです。加えて、CNNは階層的な特徴抽出が可能で、異なるスケールのパターンを段階的に学習できる特性を持っています。
提案手法の最も重要な革新は、Multi-head Convolutional Modulation(MHCM)ユニットの導入にあります。この技術では、異なるサイズのカーネルを複数同時に使用することで、様々なスケールでの依存関係を同時に捉えることが可能になります。
例えば、オンラインショッピングでユーザーが「スマホ→ケース→保護フィルム→イヤホン→ノートPC→マウス」という順序で商品を閲覧した場合を考えてみます。サイズ3の小さいカーネルは「スマホ→ケース→保護フィルム」のような直接的な関連商品の流れを捉えます。サイズ5の中程度のカーネルは、スマホ関連商品からPC周辺機器への興味の移行という、より大きなパターンを認識します。そしてサイズ7の大きいカーネルは、セッション全体を通じた電子機器への関心という全体的な傾向を把握します。これらの異なるスケールの情報を同時並行で処理し、統合することで、ユーザーの短期的な興味の変化を多角的に理解することが可能になります。
ZOZOのような大規模システムでも導入できる可能性があるモデルアーキテクチャだと感じました。まず処理速度の面で、Transformerベースの手法と比較して計算量が大幅に少なく、リアルタイム推薦に適しています。また、複数サイズのカーネルを使用することにより、ユーザーの興味の移り変わりを追跡し、衝動買いやトレンドの影響、季節をまたいだ長期的な興味を適切に反映できると考えられます。
私が改善しようとしている商品詳細面の推薦システムに新たな選択肢となるような、興味深い内容でした。
さいごに
今回は、DEXA2025に参加した感想や内容の一片をお伝えしました。
特に経験して良かったことは、トップ層の研究者や開発者たちが持つ知的好奇心の強さと行動力を直接感じることができたことです。
このような熱意に触れられたことは、将来の糧になると感じています。ここで得られた知見や経験を今後の開発に取り入れ、より良いサービス開発をしていきたいと思っています。