自然言語処理業界では、業績という面では国際会議が主戦場となっています。12
NLP分野外の人のために、簡単に主な国際会議を紹介したいと思います。
元々のモチベーションは以下のツイートをうけて、NLP系の会議の読み方を紹介しようと思ったことです。せっかくなら簡単な説明も書こうかなと。
なお、読み方については、僕の周りはこう発音していた、というだけなので、他の発音してる人もいると思います。 基本的には[ACL Anthology](http://aclanthology.info/)に載ってる国際会議[^P]を紹介していきますし、興味のある人はACL Athologyで実際に論文を読んでみてください。 並びは、なんとなく僕が上位だと思ってる順ですが、人や分野によって割れると思ってます。[^GS] 突っ込みは大歓迎です。IJCNLPって普通どう発音するんでしょうか?
— Hideki Nakayama (@n_hidekey) 2017年7月12日
2017.08.17修正
CoNLLの位置について3rd Tierより上ではないのか、という意見を複数いただきました。
Shared Taskのイメージが強かったので、通常のResearch paperの位置付けを正しく認識していませんでした。
皆さんの意見に基づき2nd Tierに移動しました。
また、ACLの開催地についても、オセアニアも書いた方がよいという指摘を受けました。
こちらは、認識していたものの記述が漏れていましたので、修正しています。
その他、突っ込みお待ちしています。
2020.07.11修正
AACLについて、少しだけ書きました。
一線を離れて久しいので、詳しい方是非補足情報お願いします。
2021.05.06修正
EMNLPのFindings、AACLについてと、ACL AnthologyのURLの情報を追記しました。
間違った情報への突っ込みとACL Rolling Reviewについての情報をお待ちしてます。
2024.06.21修正
LRECとCOLINGが交互開催になる情報を追記しました。
1st Tier
ACL、EMNLP、NAACLは間違いなく自然言語処理業界の最難関会議でしょう。
採択率は20~30%で2nd Tierと似たようなものですが、実際の難易度にはやはり差がある印象です。世界中の研究者達と争って上位2、3割と言えば、どれだけ大変か想像できると思います。
ACL (えーしーえる) (P)
間違いなく言語処理業界で最上位に位置する国際会議。3年周期で北米、アジア・オセアニア、ヨーロッパで開催される。開催地ごとにNAACL、IJCNLP、EACLと共催される(らしい)。今年(2017年)はカナダのバンクーバーでNAACLと共催。
ACLで検索して、Asia Champions Leagueというサッカーの大会が出てくるのはWSDのお約束。3
Student Research Workshopという学生向けの発表枠がある。ACLに行ってみたい学生の方はこちらにチャレンジするのもいいのではないでしょうか。
EMNLP (いーえむえぬるぴー) (D)
NAACLの方が上という意見もありますが、敢えて2番目に書いてます。何故かと言えば自分が通したことがあるから、という非常に個人的な理由です。
昔はWorkshopだったらしく、ACL Anthologyでも2006年まではWorkshop枠のページにリダイレクトされています。
一応名前にEmpericalと付いていますが、2017年現在あんまりEmpericalかどうかは関係ない印象です。
昔は、ShortとLongの区別なく投稿して、査読結果によってLongをShortに縮めてCamera radyを出すスタイルだった気がしますが、最近は別々に受け付けるようになったようです。
あと、Author Responseがあるのが特徴的でしたが、最近はACLなどでも導入されたようです。
2020年からはFindingsという制度が導入されました。4
本会議には落ちたけど、ある程度のクオリティがある論文に対してFindingsという形でPublishすることを認めるという制度のようです。
arXivと違ってPeer-reviewを受けている、ということがポイントのよう。
Findingsで発表していることが他の国際会議に投稿することの妨げにならないようにしたいようですので、今後の運用に注目です。
NAACL (なっくる/えぬえーえーしーえる) (N)
NAはNorth Americanで北米域で行なわれる会議です。北米ということもあり、「日本語の」研究をしているとなんとなく距離を感じる学会。試しにJapaneseで検索した感じだと、「日本語の」研究はほとんどないですが、翻訳や多言語の研究で日本語が含まれていることは多少ある印象です。
勿論、北米には多くの研究者がおり、人によってはACLより難易度が高いという意見もあり、英語や翻訳をテーマにした研究をしている人にとっては、EMNLPにも負けず劣らずの会議と言えると思います。
HLT?正直よく分からないです。発音は「はると」だと思います。
2nd Tier
CoNLL、COLING、EACL、IJCNLP、LRECあたりがこの位置と言えると思います。
頑張った研究なら、このあたりまでの会議に通したいラインではないでしょうか?
LRECをここに入れるかは微妙でしたが、後述の理由により入れています。
CoNLL (こぬる) (K)
個人的にはShared Taskの印象が強い会議。また、CoNLL形式という、この会議の名を冠したコーパスのフォーマットも存在したりします。
名前にLearningとあり、学習系の手法がメインです。
あまり知名度が高くないという指摘もあるのですが、会議で採択されている論文数が少なく、サーベイ中にCoNLLの論文に出わわないのが原因かなと思ったり(半分、正しく認識してなかった言い訳ですが)。
COLING (こーりんぐ/こりんぐ) (C)
ACLよりも古い歴史を持つ国際会議。歴史があるからか、自然言語処理分野外の人からは知名度が高いらしい。実際の立ち位置としては、このあたりが妥当かと。
2年ごとの開催で、2016年は大阪で開催されました。
2024年にLREC-COLING2024としてCOLINGと合同開催し、以降はLRECとCOLINGで交互に開催となるようです。
COLINGが2025年と2027年、LRECが2026年と2028年いった形での開催になるとのこと。
2012年のムンバイ開催の際に運営がアレだった印象が非常に強いです(参加してないですが…)。
A5サイズで1カラムにしてみたり、アブストに第二言語を入れれるようにして対訳コーパスを作ろうとしてみたり、色々チャレンジングな取り組みをしていたんですが…
Accepted Paper発表時点で、現地に行ってみないと発表できるか分からない補欠枠みたいなのがあったような記憶もあります。
こことかを見てみるといいと思います。
ちなみに現地でも色々あったらしいです。
EACL (いーえーしーえる) (E)
ヨーロッパで開催される国際会議です。欧州各国の言語もそうですが、それらに跨って多言語で実験した手法が好まれる印象があります。
Colingとどちらが上かは意見が分かれるところだと思います。「日本語の」研究者(ry
今までは2、3年ごとの開催でしたが、2020年からは毎年開催になるようです。
IJCNLP (あいじぇーしーえぬえるぴー) (I)
名前からは分かり辛いですがアジア系の国際会議です。どうも意図的にアジアっぽくない名前にしたらしいのですが詳細は分かりません。2年ごとの開催で2013年には名古屋で開催されています。
一般的には上記2つの国際会議よりは1段下なイメージだと思いますが、アジア系の言語を扱うならば十分投稿先の選択肢に入ってくるのではないでしょうか。中国やインド、そしてアラビア語圏がより盛り上がってこれば、また立場も変わってくるかもしれません。
AACLの登場により、今後立ち位置が変わっていくことが予想されます。
2020年と2022年はAACLと、2021年はACLとの共催ということですが、今後も名前だけは残っていくのでしょうか。
AACL (えーえーしーえる) (なし)
北米のNAACL、ヨーロッパのEACLに対応する、アジアでのACL系会議。
2020年12月が初回(しかもオンライン)で、IJCNLPと共催でした。
次回は2022年でまたもIJCNLPと共催のようです。このままIJCNLPとの共催が続くのでしょうか。
IJCNLPの変わりの立ち位置になることは間違いなさそうですが、ACL系になったことで評価が上がるかは今後の動向次第かと思います。
なお、初回が2020年だったので、ACL Anthologyでのアルファベット表記はありません。
LREC (えるれっく) (L)
LRECは言語リソース系の国際会議で、今まで紹介した国際会議とは多少赴きが異なります。
「ゆるれっく」と呼ばれたり、リゾート学会という赴きもあるのですが、あえてこの位置に入れています。
自然言語処理においては、コーパスや辞書などの言語リソースは極めて重大な意味をもっており、LRECはそこに真剣に取り組んでいる研究者に対するある種のご褒美ではないかという意見もあります。また、実際にGoogle ScholarではNAACLに次ぐ位置につけています。これは、言語資源の研究が他の研究を支えている証拠と言えると思います。
2年ごとの開催で2018年は宮崎で開催予定です。
COLINGの項にも書きましたが、LREC-COLING 2024以降はLRECと交互開催です。LRECとしては偶数年開催の予定なので、これまでと同じです。
3rd Tier
上に書いてきた国際会議よりは一歩以上下であることには異論はない会議群だと思います。
ただ、査読などもきちんと行なわれますし、まずはPublicationすることに価値もあると思うので、自信がない学部生、修士生なんかは、これらの学会に投稿し、そして参加して国際会議の流れを掴むのもいいと思います。
正直、よく分かってない部分が大きいので、名前と読み方を列挙していきます。あと、ワークショップも入れてます。読み方を書いておくことに価値があると思ってる記事なので…
- CICLing (しっくりんぐ/さいくっりんぐ)
- PACLIC (ぱっくりっく) (Y)
- PACLING (ぱっくりんぐ)
- WAT (わっと)
- SemEVAL (せむえう゛ぁる) (S)
- RANLP (らんるぷ) (R)
参考にしたページとか
ここまで書いといてなんですが、下記ページを自分で見ていただく方がいい気がします。
自然言語処理のトップカンファレンス(小町さん)
ACL 2016 参加報告(笹野さん)
NAACL-HLT 2016 参加報告(鈴木さん)
国際会議論文の読み方・書き方(Grahamさん)
IJCNLP2013 参加報告(その1)(江原さん)
最後に
NLP分野外の人は1st/2nd Tier通してる人は凄い人なんだな、ぐらいの感覚で見てもらえればいいと思います。
これからNLPに取り組む学生は1st Tier(特にACL)目指して頑張ってください。
あと、国際会議はあくまで国際会議なので、その人の研究が本当に素晴しいかは、自分の目でその研究を確認することが大事だと思います。NLPの中でも国際会議に通りやすい分野と通りにくい分野もあったりしますし…