paper
survey
論文読み
機械学習マッチョ

論文の読み方の論文 "How to Read a Paper" 和訳まとめ


はじめに

SOTAが次々と達成されるこのご時世、論文に触れて情報を収集することが重要になっています。

機械学習マッチョになりたいので毎日論文を読むことを決めたのですが、そもそも論文の読み方がわかりません。

そういうわけで論文の読み方について書かれた論文を読んだので、それを簡単にまとめます。


How to Read a Paper

http://blizzard.cs.uwaterloo.ca/keshav/home/Papers/data/07/paper-reading.pdf


ABSTRACT

研究者の人たちは論文を読むのに膨大な時間を費やしているが、その読み方についてなかなか教わる機会がなく、多くの時間を無駄にしている。そこで、この論文では効率的かつ実用的な "three-pass method" という論文の読み方を紹介する。また、その手法をliterature survey(文献調査)に活用する方法も紹介する。


1. INTRODUCTION

研究者は様々な理由で論文を読む必要があり、毎年数百時間も費やしている。


論文の効率的な読み方は重要であるが、教わることは滅多にない。


筆者は 'three-pass' approachを実践することで、全体感をつかむ前に細部にハマってしまうことを避けている。


またその論文を読む前に、読了に必要な時間を概算している。


2. THE THREE-PASS APPROACH

論文を上から下まで読み進めるのではなくて、3通りの方法で読むのが重要。


それぞれの読み方には明確なゴールがあり、それぞれの方法で順に読み進めることで理解が深まる。


The first pass: 論文の大まかな考え方を理解する


The second pass: 論文の内容をあらかた理解する(詳細は理解していない)


The third pass: 論文を深く理解する


2.1 The first pass

論文にさっと目を通し全体感をつかむ。


→論文を読み進めるか他の論文に移るかを決められる(時短)


5〜10分で以下のことを行う。


1. 論文のtitle, abstract, introductionを注意深く読む

2. 各section、sub-sectionの頭だけを読む

3. 数学的な内容に軽く目を通し、論文で扱われている理論的な分野を把握する

4. conclusionを読む

5. referenceを確認し、自分がすでに読んでいる文献があればチェックする

the first passが終わった後は、以下のfive Csについて答えられなければならない。

1. Category:


どんな種類の論文?(何かの評価論文なのか、既存のシステムの分析論文なのか、など)


2. Context:

他に関連する論文は?問題を分析するのに用いられている基礎理論は?


3. Correctness:

論文内での考察は妥当か?


4. Contributions:

論文が一番貢献しているものは何か?


5. Clarity:

論文はうまく書かれているか?(可読性)

論文を書く際には、各sectionのタイトルやabstactの書き方に注意すること。


この段階を終えて概要がつかめない場合は、中身を読まずに切られることが多い。


(5分経っても概要を理解できないような論文は一生読まれない)


論文の内容を良く示した"graphical abstract"は素晴らしいアイデア。


近年の科学雑誌に掲載されている論文でもgraphical abstractが使用される頻度が増えてきた。


2.2 The second pass

このフェーズでは論文を注意深く読むが、根拠などの細かい部分は無視する。


読みながら重要なポイントに線を引いたり、空白部分に自分でコメントを書くのがオススメ。


Augsburg大学のDominik Grusemannとかいう偉い人は「わからなかった用語や著者に質問してみたいことを書き出す」ことを提案してる。


  1. 論文内の図やダイアグラム、イラストを注意深く見る。グラフには特段注意する。
      軸のラベルは正しいか? エラーバーから論文の結論が統計的に有意か?


  2. 未読の引用論文を忘れずにチェックすること(論文の背景について学習する際に有効)

経験豊富な研究者でも1時間ほどかかる。


この段階が終わるときには、論文の内容を大まかに理解していなければいけない。


つまり、論文の趣旨を、根拠となるエビデンスと共に要約し、誰かに説明できなければいけない。


このレベルの理解度は、興味があるけど専門分野ではない論文に最適。

the second passが終わっても論文が理解できないときは?


- 原因:

考えられるのは論文の分野や扱われている理論や技術が馴染みがない場合。


あるいは筆者が用いた根拠や実験の技術自体が理解できない場合。(→そもそも論文が理解不可能)


あるいは実証性の乏しい粗末な論文であったり疲労困憊の状態で深夜に読んでいたり…


- 対策:

1. そっ閉じ/その論文が今後のキャリアでの成功に必要ないことを願って放置する

2. 再度読み直す(背景的な記事や論文を読んだ後に)

3. とりあえず次のステップに進む


2.3 The third pass

論文を完全に理解したいとき、特に論文のレビューを行う場合にこのステップが必要。


ここでのポイントは論文を"virtually re-implement"(脳内再構築)すること。


自分で再構築した内容と実際の論文の内容を比べることで、論文の新規性を確認するだけでなく、論文の誤りや言及されていない新たな考察に気付くことができる。


細部にまで最新の注意を払うことが必要で、全ての主張に含まれる全ての推察について検討し、妥当性を確認しなければならない。


それに加えて、もしも自分がそのアイデアを表現するにはどのように記述するかということまで考えないといけない。


そこまで考えて筆者の論文と比較することで、論文の根拠についての深い洞察や、論文における表現技術が得られる。


またこの作業中に、自分の将来の活動についてのアイデアを書き留めるべき。

この作業は熟練した研究者でも1〜2時間ほどかかる。


この段階を経て、論文の長所と短所を理解するだけではなく、記憶を頼りに論文の全ての構造を再構築できる状態になっていなければいけない。


長所と短所とは具体的に、隠れた考察や先行研究が紐づけされていない部分、実験や分析手法が含む潜在的な問題などを指摘できないといけない。


3. DOING A LITERATURE SURVEY

膨大な論文の中から自分に必要なものを探すのは大変(特に自分が疎い分野においては)


なので、文献調査にも'three-pass' approachを活用しよう。


1. 近年の動向の把握

Google Scholar, CiteSeerなどのアカデミックな検索エンジンで、5つの「その分野において最近のもので多く引用されてる論文」を探す。ここでは'the first pass'を使って、論文の概要を把握して、関連する論文を確認する。近年のその分野における動向を理解する。


2. 主要な論文or人物の特定→主要なカンファレンスの特定

繰り返し引用されている論文や筆者を見つける。それがその分野でキーとなる論文or人物。その筆者のサイトに行き、最近のどこで論文を発表したか確認する。そうすることで、その分野で主要なカンファレンスやジャーナルが特定できる。(有名な学者は有名なカンファレンスで発表する)


3. 主要なカンファレンスでの最新の論文を読む


4. RELATED WORK

論文のレビューをするなら

- T. Roscoe, “Writing Reviews for Systems Conferences,”

論文を執筆するなら

- H. Schulzrinne, “Writing Technical Articles,”

- G.M. Whitesides, “Whitesides’ Group: Writing a Paper,”

リサーチスキルについての全般的なまとめ

- S. Peyton Jones, “Research Skills,”

論文のレビュー用に'three-pass' approachをまとめた'review matrix'(ダウンロード可能)

- I.H. McLean, “Literature Review Matrix,”

論文のレビュー用に'three-pass' approachをまとめた'review matrix'(ダウンロード可能)

- I.H. McLean, “Literature Review Matrix,”