はじめに
特に分野外の方やGECに興味がありこれから始めようとしている方にとって、「結局GECが強いところはどこなの?」「伝統的に日本国内では盛んだと聞いたことあるけど世界でみるとどうなの?」のような疑問を抱くことがあるかと思います。実際、私も含め普段GECの研究をしている人からしても「なんとなくあそこのチームよく見るな」といったざっくりとした感覚はありますがそこまで解像度は高くなかったりします。そこで本記事では、トップカンファレンス採択論文数という一つの軸に基づいてGEC研究に強みを持つ組織について調査してみたいと思います。
調査方針
調査方針についてはいろいろ議論の余地があるところですが、今回は以下の方針にしました。
- 直近5年(2017~2021)のACL, NAACL, EMNLPの論文を対象
- Findingsは含めるが、0.5本換算
- 所属は第一著者の所属(複数ある場合は主所属)のみカウント
所属のカウントに関しては、本来であれば日本所属の言語処理トップカンファレンス論文 (2021年)のように著者全体で配分する方が良いとは思うのですが今回は面倒だったのでこのような荒い近似とさせてください。
なお、具体的な対象論文の集計手順としては、文献管理サービス(今回はpaperpileを使用)で対象論文が含むフォルダを用意し、メタデータに所属ラベル(第一著者の所属)を付与したうえで、spreadsheetにexportして集計・分析という流れで行いました。
対象論文の収集に関しては、単にタイトルに「Grammatical Error Correction」と入っている論文のみを機械的に収集するだけでなく、タイトルに入っていなくてもGECを扱っている論文(例: Awasthi et al., (2019))は含め、逆にタイトルに入ってはいるものの内容としてはGECスコープ外な論文(例: Zomer and Garcia (2021))は除外するなどある程度人手でチェックしました。
結果
上述の方針で論文を収集したところ、合計37論文となりました。実際に収集した論文リストはこちらに公開しているのでご自由にお使いください。以下に、所属ごとの論文数を示します。
所属ごとの論文数
ここ5年でみると、MicrosoftやGoogleといったTech Giantの参入が目立ちます。これは、もちろんGECのニーズが社内的に増えたという要因もあるとは思いますが、GECでは2016年頃からNMTアプローチが主流となったため、Tech GiantにいるようなMTに強い人たちが参入しやすくなったという要因も個人的にはあるように感じます。特にGoogleに関しては、私の知る限りでは2017以前までGECに関する研究はほとんどやっておらず、おそらくLichtarge et al.,(2018)が最初のGEC論文になるかと思います。当時この論文がarxivにupされたのを見たときに、ついにGoogleもGECにきたか〜と衝撃を受けたのを記憶しています。
唯一大学でそのようなTech Giantと並んでいるのが、ケンブリッジ大学(University of Cambridge)でした。ケンブリッジ大学はケンブリッジ英検で知られるように昔から言語学習や評価に強みを持つからか、黎明期から積極的に研究を行なっている組織の一つです。直近5年だけみても、ERRANTというシステム出力に対して誤りタイプを自動付与してくれる分析・評価ツールを提供したり、GECの国際コンペ(Shared Task)であるBEA-2019 Shared Taskを主催&習熟度付きデータセットを提供したりなど、GEC分野全体にとって非常にインパクトのある仕事をしており、我々がGECをリードしていくんだ!という気概を感じます。
日本の研究機関で私の所属先でもある理研AIP(RIKEN AIP)は、3本で4位?でした。理研AIP(というか自然言語理解チーム)では、2018年頃から本格的に研究活動を開始して以降、GECを含む言語教育・アセスメント領域に関する研究を積極的に行なっています。上位3つ(Google, Micorosft, ケンブリッジ大学)と比べると少数精鋭だと思うのでそれにしては頑張ってる方なのではないかと思います(自分で褒めていくスタイル)。
その次に多かったのがシンガポール国立大学(National University of Singapore)で2.5本でした。個人的にはこの結果は少々意外でした。というのも、こちらの記事にも書かれていますが、シンガポール国立大学が主催したCoNLL-2013, CoNLL-2014といったShared Task及びそこで提供されたベンチマーク(共通の評価データと評価スクリプト)によってGECの研究がここまで発展したと言っても過言ではないからです。余談ですが、上述したERRANTの開発者でありBEA-2019 Shared Taskのメインオーガナイザーでもあるケンブリッジ大学のChristopher Bryant氏は2年ほどシンガポール国立大学のHwee Tou Ng氏のもとでRAをしており、当時CoNLL-2014 Shared Taskのオーガナイザーとしても参画していました。その後ケンブリッジ大学に移られた後に自らShared Taskを主催し、今ではGEC研究を牽引する一人となられてる展開をみるとなかなか胸熱ですね...(私だけ?)。
他は一つ一つピックアップはしませんが、全体的にみると、GECは比較的マイナーなタスクといえど、思ったよりプレイヤーの層が厚いのかなという印象を受けました。
著者ごとの論文数(Top10)
Authors | # papers |
---|---|
Tao Ge (Microsoft) | 4.5 |
Furu Wei (Microsoft) | 4.5 |
Masato Mita (RIKEN AIP) | 4.0 |
Kentaro Inui (Tohoku University) | 3.5 |
Ming Zhou (Microsoft) | 3.5 |
Christopher Bryant (University of Cambridge) | 3.0 |
Masahiro Kaneko (Tokyo Metropolitan University) | 2.5 |
Syun Kiyono (RIKEN AIP) | 2.5 |
Hwee Tou Ng (National University of Singapore) | 2.5 |
Jun Suzuki (Tohoku University) | 2.5 |
: | 2.0 |
せっかくなのでおまけとして著者ごとの論文数(Top10)を出してみました。カウントの仕方は先ほどと同じで、同数の場合はアルファベット順、()内は主所属のみ記載しています。こうしてみると、Top10の半数は日本人というのが一つ驚きなのと、組織別で1位であったGoogleやケンブリッジ大学は著者別でみるとあまりランクインしていないことから、層の厚さ?(特定の人に偏っていない)のようなものが垣間見えてそれはそれでさすがだなと思いました。
おわりに
今回はあくまでトップカンファレンス採択数という一つの軸で議論しましたが、「研究が強い」といっても本来様々な尺度がありえます。例えば、数ではなくインパクト(引用数など)が重要だという意見もあるでしょうし、トップカンファレンスが全てではないという意見もあると思います。実際、GECに関しては特にBEAと呼ばれる教育応用系のワークショップなんかには数多くのGECに関する論文があり、非常に面白いものもたくさんあります。そのため、もしこれからGECを始めようという方や興味関心のある方は、今回対象とした論文以外も含め最終的にはぜひ自分の目で確認してみてください。