アドベントカレンダー23日目です
昨日の@Kaiseiblogの記事では、SEO対策に関するテクニックをとてもわかりやすく説明してくれました👏
アドベントカレンダーも残り2日ですね
今日は急遽内容を変更しまして、国際会議について話します
はじめに
- 自然言語処理の国際会議に関して、まとまった日本語の記事が少なく、私自身ものすごく論文探しや学会探しに苦労したので、この記事を書きます
↓もうまさしく私
M1 の人を見ていると最初は「論文(国際会議)にもレベルがある」ということをよく分からないようで、自分の研究に近いからと日本語の論文や、初めて聞くような名前のワークショップの論文を参考にしてしまうようなのだが、いい論文を書くためにはいい論文を読まなければならず、基本的には上に挙げたようなトップレベルの国際会議の採択論文に最初はたくさん目を通すのが近道なのではないかと思う。
対象者
以下の方を対象者にして、私が参考にしたサイトをまとめます
- いい論文を読んだ方がいいという話はよく聞くものの、その論文がどこにあるのか分からない人
- どこの学会で発表したらいいか探し方が分からない人
- 自然言語処理の研究をする予定の人
発表する学会探し、論文探しについて
自然言語処理の論文
ACLAnthologyから先行研究をひたすら漁っていました
学会の難易度
一覧表示で確認できます
以下のようにランク付けされています
CORE2020 Summary:
A* - 8.39% of 751 ranked venues
A - 22.37% of 751 ranked venues
B - 33.95% of 751 ranked venues
Australasian B - 1.86% of 751 ranked venues
C - 31.69% of 751 ranked venues
Australasian C - 1.73% of 751 ranked venues
Other - 132 total
採択率
上記サイトで気になる学会が見つかったら、以下サイトで検索します
Computer Scienceの直近の学会
締め切りなど時系列に沿ってわかりやすく表示してくれています
有識者の公開資料
都立大 小町先生のブログ
自然言語処理の研究をするなら小町先生のブログは読んだ方がいいと、先輩に教えてもらいました
多分ニューラルな手法を用いた研究のうち、おもしろいものは ACL/NAACL/EMNLP などのトップ国際会議で発表され、もっと研究の多様性や言語学的知見を大事にする COLING にはあまり来なかったということだろうが(それはとてもよいことで、自分的には COLING が一番好きな国際会議でもあるのだが)、年に1回くらいは ACL/NAACL/EMNLP クラスの国際会議に参加しないと、トップカンファレンスの相場観が分からなくなってしまう気がした(プログラム委員として査読をしていると、まだ雰囲気は分かるが、どうしても熱気までは伝わらない)
うちの研究室で少なくとも内部進学した学生は修士論文相当の研究を英語で書けば IJCNLP/PACLIC/PACLING あたりの full paper には普通に通るはずなので、みんな最低このラインの国際会議では発表できるようにしたいのである(いまのところ半分くらい)。
東大 松尾研究室のサイト
国際会議にも特徴があります。例えば、**自然言語処理系は一般的に「まじめ」な会議が多いです。既存の問題設定で、精度を挙げる手法を提案し、完全に評価する必要があります。**逆に、WWWは観客重視の学会です。トレンドに乗った研究で誰しもが聞きたいと思う、面白い研究が通ります。もちろん、手法や評価も必要ですが、相対的な重要性は低いです。ISWCは、珍しくコンセプト論文が通りやすい学会です。IJCAKやKDDは手法が重視されます。
Qiitaの記事
1nd Tier
ACL、EMNLP、NAACLは間違いなく自然言語処理業界の最難関会議でしょう。
_
2nd Tier
CoNLL、COLING、EACL、IJCNLP、LRECあたりがこの位置と言えると思います。
_
3nd Tier
CICLing (しっくりんぐ/さいくっりんぐ)
PACLIC (ぱっくりっく) (Y)
PACLING (ぱっくりんぐ)
WAT (わっと)
SemEVAL (せむえう゛ぁる) (S)
RANLP (らんるぷ) (R)
論文の書き方について
NAIST Grahamさんの資料
特にp28以降からの論文の書き方に関して何度も見てました
以下一部抜粋
べからず
● 「近年、…」
● 「本論文の構成は、…」
べし
● 違いを明らかに
● 図を活用
● 問いかける
● 貢献を明らかに
東大 松尾研究室のサイト
国際会議に投稿しようと決めました。2週間後です。がんばるぞ!最初、どう書こうか考えます。Introductionが書けずに悩みます。うーん、どう書けばいいかなぁ。特に書き出しが難しい。全然筆が進みません。実験結果ももっとよくないといけないような気がします。もう少し結果を良くしよう、というわけで、少しプログラムを書き換えて再実験をやったりします。そうこうしてるうちに、残り1週間です。まだ1ページ半です。やばい!だんだん大胆になってきます。残り4日です。まあいいや!意を決して、がんがん書き始めます。だいぶ調子に乗ってきました。半分までいきました。あと2日です。間に合うか!残り1日です。あと規定のページ数まで2枚。あと6時間、なんとか最後のページまで来て、Conclusionを書ききりました。残り3時間です。ふぅ、なんとか間に合った。まだ時間あるな。ちょっと読み直してみます。あれ?結構、最初と言いたいこと変わってるなぁ。少し修正していきます。結構、直すところあります。あー、よく見ると図も変だなぁ。数式も直そう。とりあえず半分くらい直したところで時間が来ました。投稿します。ふぅ、大変だった。でもよく頑張った。ビールでも飲んで満足感に浸ろう。通るといいなぁ。。
で、落ちます。
完成度を上げることの重要性が🍺
完成度を上げるとは、自分で修正するところがなくなるまで、修正を繰り返すことです。
初稿(n=1)では、通る確率はp0のわずか6%に過ぎません。第2稿になると、23%と一気に4倍、確率があがります。第3稿では45%、第4項では65%まであがり、第7稿までいくと96%と、ほぼ完全にポテンシャルを発揮できます。
英文公正ミューグループのサイト
以下のようなお作法について参考にしました
なるべく右側の表現を使うように心掛けよう。
例)
about/around → approximately
become large → increase
but → however
especially → particularly
get → obtain
is known to be → is
in order to → to (論文中では簡潔な表現が好まれるため。しかし、目的を示す不定詞であることがわかりにくい場合には"in order to"を使う。)
is done → is carried out
of great importance → important
red in color → red
reported in the literature → reported
round → circular
small in size → small
take → 文脈により適切な単語を使う
think → consider
though → although
Grammarly
- 自動で英文法やスペルミスをチェックしてくれる
- 文章の点数を100点満点で評価してくれる
- 世界で一番ユーザー数が多くて、安全性も高いことで有名らしい
無料版でも十分使えたのですが、先生のお言葉に甘えて有料版を使わさせて頂きました🙇♂️
できた文章をDeepLで翻訳しておかしい箇所がないか確認した後、Grammarlyで文法ミスや自然な表現への変換などをしてました
おわり
-
本記事で紹介した資料には本当に助けられていて、資料を公開してくださった方々には感謝しかないです
-
査読期間って結構長いので、「もっと早くに早くに提出しておけばよかった」「えっもう締め切り終わってる」なんてことにならないように...