情報検索の最新トレンド
ACM SIGIRといえば、情報検索分野のトップカンファレンスです。
今年は7/21-25開催ということですが、アクセプトペーパーが揃っているので一足先にどんな論文が出ているのか確認していきます。
記事の目的と注意
この記事では、論文の内容というよりも「どんな論文が出ているか」というざっくり傾向のみをお話します。
なので、タイトルやキーワードから傾向を見ていくに止まるので、「実際にどんな内容が書いてあるか」については気になった方が各々確認していただけると良いかと思います。
ということで、この記事では以下を確認していこうと思います。
- ざっくりキーワード集計ベースのトレンド
- タイトルなどの単語集計ベースのトレンド
- 私が気になったタイトルちょっとピックアップ
忙しい人のための全体まとめ
- Full Research PapersのキーワードとFull Research Papers, Short Research Papers, Demo Papersの単語を集計した
- 推薦システム、ソーシャルメディア、Q&Aなどが研究対象として流行っている模様
- 強調フィルタリング、ランク学習、評価に関する研究は未だに多い
- ニューラルネットワーク、ナレッジグラフ、強化学習、埋め込み系(RepresentationやEmbeddings)などのトピックに加え、
unbiased learning to rankやcounterfactual learningといったトレンドもみられる
確認方法
今回はSIGIR2019のアクセプトペーパーの論文リストを引っこ抜いてごにょごにょして色々集計してみました。
確認項目は以下の通りです。
- キーワード(Full Research Papersのみ)
- タイトルの単語(Full Research Papers, Short Research Papers, Demo Papers)
それでは内容を確認していきましょう。
Full Research Papers
今回は合計で84の論文がアクセプトされています。
キーワード
全部で**297(ユニーク)**のキーワードがありました。
2回以上出現したキーワードについて以下に示します。
| keyword | count |
|---|---|
| Collaborative Filtering | 5 |
| Recommender Systems | 4 |
| Social Media | 2 |
| Question Answering | 2 |
| learning to rank | 2 |
| unbiased learning to rank | 2 |
| counterfactual learning | 2 |
| Evaluation | 2 |
| Reinforcement Learning | 2 |
| Recommendation | 2 |
研究対象として推薦システム(Recommender Systems)、ソーシャルメディア(Social Media)、Q&A(Question Answering)などが人気っぽくて、
手法としては、強調フィルタリング(Collaborative Filtering)、ランク学習(learning to rank)、評価(Evaluation)が人気なようです。
この辺りは従来から情報検索分野でよく研究されている分野かと思われますが、、unbiased learning to rankやcounterfactual learning、強化学習(Reinforcement Learning)なんかは情報検索で今後伸びていきそうかなと思ったりします。
それにしても、強調フィルタリング強いですね!
タイトル: 単語ベース
Full Research Papers, Short Research Papers, Demo Papers合計で213の論文がアクセプトされていました。
以下、単語集計をした結果です。(forとandのようなstopwords的な単語を除いた頻度5以上の単語)
| keyword | count |
|---|---|
| Search | 24 |
| Retrieval | 20 |
| Recommendation | 20 |
| Information | 19 |
| Neural | 18 |
| Learning | 17 |
| Network | 16 |
| User | 13 |
| Collaborative | 11 |
| Social | 10 |
| Text | 10 |
| Prediction | 10 |
| System | 9 |
| Embedding | 9 |
| Networks | 9 |
| Graph | 9 |
| Classification | 8 |
| Query | 8 |
| Relevance | 8 |
| Document | 8 |
| Modeling | 8 |
| Matching | 8 |
| Model | 8 |
| Detection | 7 |
| Knowledge | 7 |
| Ranking | 7 |
| Personalized | 7 |
| Models | 6 |
| Analysis | 6 |
| Deep | 6 |
| Filtering | 6 |
| Representation | 5 |
| Embeddings | 5 |
| Evaluation | 5 |
| Using | 5 |
| Question | 5 |
| Answering | 5 |
SearchやRetrievalは「まあ、そうだよね」感ありますが、Neural Networkなんかはやはり流行りっぽいですね。
ちなみに、昨年のSIGIR2018のチュートリアル「Jun Xu, Xiangnan He, Hang Li. Deep Learning for Matching in Search and Recommendation」はこの辺りの知見がまとまっていて必見です。手前味噌ですが、このチュートリアルの深層学習一歩手前までを解説したこちらの記事も参考にしていただければと思います。
あとはKnowledge Graphも非常に流行っていると思います。
それからRepresentationやEmbeddingsなどのベクトル化、次元圧縮なども最近のトレンドっぽいですね。
タイトル: 複合語ベース
単語のみだとそっけないので、gensimのphraseを使ってbigram、trigramも抽出しました。
bigram(頻度2回以上)
| keyword | count |
|---|---|
| Information Retrieval | 9 |
| Network for | 6 |
| Neural Network | 4 |
| Document Ranking | 4 |
| Question Answering | 4 |
| Platform for | 4 |
| Collaborative Filtering | 3 |
trigram(頻度3回以上)
| keyword | count |
|---|---|
| Neural Network for | 4 |
| on Social Media | 2 |
| An Analysis of | 2 |
| One-Class Collaborative Filtering | 2 |
| Query Performance Prediction | 2 |
| Network for Recommendation | 2 |
Q&AやSocial Mediaなどのサービスはやはり研究対象として良く使われているのかなと思われます。
おまけ: 個人的に気になった論文
以下、タイトル気になった論文をメモしてます。
内容は読んでませんので、トンチンカンなこと言っていたらすみません。
個人的に気になったunbiased learning to rankやcounterfactual learningについての論文。
- Rolf Jagerman, Harrie Oosterhuis and Maarten de Rijke. To Model or to Intervene: A Comparison of Counterfactual and Online Learning to Rank from User Interactions
- Zhichong Fang, Aman Agarwal and Thorsten Joachims. Intervention Harvesting for Context-Dependent Examination-Bias Estimation
- Aman Agarwal, Kenta Takatsu, Ivan Zaitsev and Thorsten Joachims. A General Framework for Counterfactual Learning-to-Rank
タイトルがすごいキャッチーな論文。
- Aymé Arango, Jorge Perez and Barbara Poblete. Hate Speech Detection is Not as Easy as You May Think: A Closer Look at Model Validation
どの辺にインスパイアされたんだ!?という興味をそそられる。
- Yukun Zheng, Jiaxin Mao, Yiqun Liu, Zixin Ye, Min Zhang and Shaoping Ma. Human Behavior Inspired Machine Reading Comprehension
サーベイ論文かな?
- Oleg Zendel, Anna Shtok, Fiana Raiber, Oren Kurland and Shane Culpepper. Information Needs, Queries, and Query Performance Prediction