本記事は K3 Advent Calendar 2024 23日目の記事です
本記事では、趣味がSurveyで毎日論文漬けの僕から、論文の探し方・読み方のTipsを伝授します!
もちろん、研究分野によっても論文の書き方や特徴は変わってきます!基本的に普遍的なことを書くつもりですが、僕の専門であるコンピュータサイエンス・機械学習・コンピュータビジョン・自然言語処理の分野に依存した部分もたたあると思います!あくまで参考程度に、もし指導教員の話とコンフリクトしたら、そちら優先してマージしてください!
この記事を読んでる人の中には、来年度から研究室に配属される方や研究を始める方も多いと思います!
面白くて、良さげなジャーナルや国際会議に採択される研究テーマを見つけるにはSurvey (文献調査) が極めて重要です!正直、学部で得た学びだけでそう簡単に良いテーマなんて見つかりません...。まずはその研究分野でどんな取り組みが現状行われていて、まだ残っている課題は何なのか。それが分からないことには研究を始められません!
また、自身のテーマとは全然違う論文に研究を進めるヒントが隠されていることも、よくあることです!
さて、指導教員🧑🏫はいいます。「とりあえず10本くらい論文読んできて〜」と。
個人的にも50本くらい読んだら、やっとその分野の課題がわかってくるかなぁと思っています!
10本!?50本!?今頃皆ビビってると思います。あー無理だ。僕に研究なんてできないんだ。英語そんなに得意じゃないし...。まず何読んだらいいのか分からないし...
そんな悲観しないで...、僕も最初はそう思いました!でも安心してください!論文の効率的な探し方や読み方をマスターすれば、通学の電車の中で数本軽く読めるようになっちゃいます!
論文の探し方
大学では大学の図書館で論文を探せ!とか言われますが、キーワード検索だけだと結構苦しかったりします
今はAIが論文を探してくれたりもするので、論文を探すのに役立つツールをいっぱい紹介しちゃいます!!
Perplexity AI
何か質問すると、そのエビデンスを踏まえた上でソースと共に回答を生成してくれるChatBotタイプのAIです。「こんな研究がしたい!」「こんな関連研究ある?」とか聞くと、良さげな論文を引用して答えてくれます。うれしい!
日本語でも英語でもOKなのもうれしい!
また、課金するとGPT-4やClaude2.1などの最新LLMも使えちゃいます!
使ってみる
何か質問してください...って聞かれてるので、自由に問いかけてみましょう!この際、「フォーカス」から「学術」を選ぶのをお忘れなく
今回僕は自動運転に応用可能なLLMによるプランニングの研究について聞いてみます!
以下の3つのプランニングに関する論文を探してくれました!
全部が直接自動運転への応用を前提とした論文ではないですが、どれも良さげですね!特にGPT-Driverなんてドンピシャだ!
SciSpace
こいつもまた論文検索できるChatBot AIです!日本語にも対応してます!
使ってみる
今度はテキストから3Dモデル生成に関する研究について探してもらいましょう
いっぱい探してくれました!LLMで生成された概要がリンクの横に「Insights」として書かれてるのも嬉しいね!
タイトルをクリックすると、そのままFull-Textが読める他、Copilotが選択個所の要約や説明をしてくれる機能も付いています!
Ai2 Open Scholar
これは2024年11月にリリースされたばかりの論文検索できるChatBot AIです!もちろん日本語対応です!
以下の論文で提案されたシステムであり、その中身もなかなか面白いです!「検索システムを組み込んだLLM」や「AI for Science (学術的研究活動そのものを支援するAI) 」に関心のある方は是非読んでみてください!
https://arxiv.org/abs/2411.14199
その仕組み上、オープンアクセスの論文 (誰でも自由に入手可能な論文) しか返してくれないので、有料ジャーナルがメジャーな研究分野の方にとっては使いにくいかもしれません!機械学習、コンピュータビジョン、自然言語処理などの分野に興味がある方にとってはかなり使いやすいと思います!
使ってみる
こいつにはゲームAIについて聴いてみましょう
引用いっぱいで答えてくれました!論文のIntroductionにそのまま使えちゃいそうな文章が出てきましたね!
Connected Papers
論文タイトルを入力すると、その論文が引用している論文(引用論文)、その論文を引用している論文(被引用論文)のネットワークを作ってくれます!
何か興味のある論文を見つけたら、これで調べて関連研究を洗いざらい読んじゃいましょう!!!
使ってみる
それでは、先ほど Perplexity AI が教えてくれた自動運転に応用可能なLLMによるプラインニングの研究GPT-Driverの関連研究を探してみましょう!
グラフィカルで楽しい!!!
関連研究のグラフが出てきました!濃いノードが最近の物で、大きいノードは超引用されてるスゴイ論文です!ノードを選択すると右側にその概要とリンクが出てきます!
ってか、クリスマスだからなんか❄️のマークが付いてる!かわいい💕
Google Schalar
Googleが提供している論文検索システムです。
使ってみる
LLMに関する研究を探してみましょうか。キーワードを入力してみます。
なんて風に普通にキーワードを入力して調査するのも良いのですが、Google Schaalrの神髄はアラート機能!
キーワードにヒットする新着論文をGmailで通知してくれます!LLMみたいな普遍的なキーワードを登録すると通知が大変なことになるので、具体的な研究テーマが定まったら、コアなキーワードを設定しておきましょう!
具体的な使い方は以下の記事を参照してね!
arXiv
コンピュータサイエンスや物理、数学を研究している皆さんお馴染みのpreprintサーバ、arXivです!
さっきから論文のリンク全部arXivの貼ってますが、上記の分野におけるpreprint (査読前の論文) は大抵ここに置いてあって無料で読めます!査読前だからと侮るなかれ、国際会議やジャーナルに通った論文のpreprintが大量に置いてあるのです!
次の「論文の読み方」セクションでもarXivを使った読み方を色々と伝授します!
使ってみる
コンピュータサイエンスってアカデミアでも結構特殊で、ジャーナルと同様に国際会議が重視される傾向があります!(理論系はそんなことないかも...。機械学習・コンピュータビジョン・自然言語処理はそう)
博士の学位を貰うためには数本ジャーナル書いてないといけないんですが、割と界隈全体としてはジャーナルより採択率20%前後のトップカンファレンスを目指して皆頑張ってます...
ってことで、機械学習のトップカンファレンスNeurIPSの採択論文をarXivで探してみましょう!検索欄に「accepted NeurIPS」と入力してみます!arXivでは投稿者が自由に記入できる「comments」の欄に採択された国際会議名を書いてくれてたりするので、学会名で検索できます!
普通にキーワードやタイトルでも検索できますが、採択カンファレンスで検索できるのは大きな強みだと思います!その学会の査読結果が返ってくる頃に調べると最新の研究を追えます!
一番上に出てきたCal-DPOってやつを開いてみます。LLMをユーザの思考に合わせて最適化する手法に関する論文のようですね!
ちなみに、arXivのリンクには投稿時期が隠されているので、その見方をここで共有しますね!Cal-DPOのリンクは https://arxiv.org/abs/2412.14516 となっていますが、最後の「2412.14516」が大事!24は2024年、12は12月って意味です!投稿仕立てほやほやですね
Twitter (現X)
皆さんお馴染み、にゃーんって投稿する専用SNSです🐈🐈⬛
思い切って皆さんの研究分野で有名な方をフォローしてみましょう!たまに論文超貼ってくれる人がいたりします!
コンピュータビジョンの分野だと、個人的にAKさんとかオススメ
OpenReview
論文を探すというより、「トップカンファレンスに採択されるには何が必要なのか?」を学ぶ場所ですが、紹介しておきます!
OpenReviewは論文の公開レビューやコミュニティによる議論を行うためのプラットフォームです。機械学習の分野でよく使われ、ICLR (アイクリアと読みます) をはじめとしたトップカンファレンスでも使われています!採択された論文の他、残念ながらリジェクトされた論文に対するレビューも見ることができます
- この点は良いね!でもここは説明不足かも!どういうこと?説明してくれる?まあでも合格!採択決定!
- 概ね良いけど、まだ足りないな~!追加実験して、これ議論してくれたら合格かな~!
- 英語勉強しなおしてこい🤬
みたいなことが議論されています!
ここで注目したいのは低評価のレビュー。「なぜ採択されなかったのか?」を理解する良いサービスです。
あ、ボロクソ言われてるのを見ると、自分の論文じゃないのに何だがダメージを食らうので、メンタルが元気な時に見ましょう! (重要)
論文の読み方
それでは続いて、皆さんに論文を読まない方法を教えます!
え?いや、読み方を教えろよ!
落ち着きましょう。殴らないで!
論文って8~10ページ、長いものだと30ページを超えるようなもんもあります。もちろん、自身の研究と深く関わるものはじっくり読んだ方が良いのですが、基本的にそれ全てを読む必要はないのです。大事なのは、何を読んで、何を読まないか!
論文と言うものは、ある程度その書き方に型があります。その型を知れば、どこに大事なことが書いてあるのかが分かるようになります
読むべきセクションを知る
基本的に論文は以下のようなセクション(章)で構成されています!
- Abstract
- Introduction
- (Related Works)
- Proposed Method
- Experiments
- Results
- Discussion
- Conclusion
まず、皆さんが読むべきはAbstractとIntroductionです!
余裕があれば、Conclusionも読んでいいかな~
Abstractは正確にはセクションではなく、他の本文とは独立したコンテンツであり、その論文全体を要約します。つまりここは大事!とりあえずこれは頑張って全部読みましょう。大体長くても300単語くらいなので、余裕で読めます。
続いてIntroduction、ここは研究背景、現状の課題、自信の提案手法、自身の提案が何に貢献するのか。をまとめます。
- 今までこんな研究がされていてー
- でもまだこんな課題があってー
- そこで我々はこんな天才的なアイデアでこれを解決するよ!
- 我々の研究はこんなにすげーんだぜ!
って感じです。ここが超重要!!!
ここまで読んで超面白かったら、具体的なProposed Methodを読み込みましょう!
ここまで読んでつまらんかったら、その論文は読まなくていいです。はい!もう1個論文読み終わりましたね。おめでとう!どんどん次の論文へと進みましょう!
速読する場合は上記で示した部分のみを読めばいいと思いますし、しっかり全文読む場合でもここに注力して
各セクションの読み方を知る
論文はパラグラフライティングで書かれます!
まず、各セクションはパラグラフ (段落) から構成され、各パラグラフは各センテンス (文章) から構成されます!この時、各セクションの1文目!これは「トピックセンテンス」と呼ばれます。ここで、そのパラグラフで扱うトピックをバーン!っと示します。その後、トピックセンテンスを補佐する「サポートセンテンス」が続き、最期に「小結論」センテンスでまとめます!
つまり、サポートセンテンスだけ読めば、大体そのパラグラフで何を言うかが分かるのです!忙しい時はサポートセンテンスだけ読めばいいでしょう。気になったら、サポートセンテンスも読む感じ
ここら辺の話は以下の記事に詳しく書いてありますので、ぜひ読んでみてください!
英語を読みたくない
もちろん、英語を読むのが一番いいです。ただ、ちょっと疲れてて英語読む気力ないよ~ってときもあると思います!
近年、ChatGPTやDeepLなど、AIを利用した翻訳は凄まじい進化を遂げていますが、論文って大抵 pdf 形式なのでコピーが面倒くさいんですよね~!そこで、HTMLに変換された論文を読む方法を伝授します!HTMLページならば、ブラウザの翻訳機能を直接使えます!
それはそうと、研究活動において英語は絶対必要になってくるので、頼りすぎは注意です!
arXiv
まずは先ほど取り上げたarXivで論文を探しましょう!ここで注目してほしいのは、右側の「HTML (experimental)」です。論文は大抵TeXで書かれますが、このTeXを解析してHTMLに変換されたページにここから飛べます
数式なんかはまだ上手く解析できてませんが、HTMLでブラウザ上で論文を読めますね!あとはGoogle Chromeのデフォルトの翻訳機能を使えば、簡単に日本語に!これなら5分でAbstractとIntroductionをチャチャっと読めます!
もちろん、自信の研究テーマに直接関連する論文はしっかり読んだ方が良いでしょう!ただ、たまには翻訳して大量の他分野に渡る論文をインプットするのも良いと思います!
ar5iv
それでは、さっき取り上げたGPT-DriverもHTMLで読んでみましょう!
あれ?「HTML (experimental)」のボタンがないぞ???pdf で英語読むしかないのか???そんな!!
なんてこともあります。このHTMLで論文を読む機能はまだ試験段階であり、ちょっと古い論文だと、まだ対応してなかったりしてます。
でも、まだ諦めるよは早いです!こんな時のための裏技を教えちゃいます!URLのxを5に変えてみましょう!
https://arxiv.org/abs/2310.01415
↓
https://ar5iv.org/abs/2310.01415
なんとHTMLで読めちゃいました!!!!
ar5ivはarXivLabsというプロジェクトの一環でTeXをHTMLページを作成しているプロジェクトです!
こちらは公式のHTMLとは逆に最新の論文(今月出たやつとか)には対応していないことがありますが、基本的にほぼすべての論文をHTMLで読むことができます!やったね!
読み方のコツ・注意点
さて、読み方が分かったら実際に論文を読んでみましょう!その際、ぜひ次の質問に答えるように読んでください!
- どんなもの?
- 先行研究と比べてどこがすごい?
- 技術や手法のキモはどこ?
- どうやって有効だと検証した?
- 議論はある?
- 次読むべき論文は?
これは落合フォーマットと呼ばれていて、詳しくはこちらの記事を読んでください
これらの質問に答えるような読み方をしていると、だんだんその研究分野における課題を見つけられるようになると思います!
これは僕も陥ったのですが、最初、論文を読むと、「はえ~賢ーい!すごー!おもろ~」という感想で終わってしまうのです。これでは自身の研究につなげることはできません!
心に査読者を持ちましょう。なぜこんな手法をとっているんだ?本当にそれが最適解なのか?他にリーズナブルな手法は無いか?
まだ残っている課題を考えましょう。
あ、ここで注意点です!
論文には最後にFuture Works (今後の課題) が書かれていることがあります。しかし、今後の課題が書かれているなら、上記で述べてきたような批判的に読む必要はありません。そこに書いてあるのだから。これが罠です!ここには「まあ、そんなん無理よな...」みたいな自明の課題が書いてあったりします!
研究はスモールスタートが大事です。スコープを縮めて、問題設定は小さく、少しづつ進めましょう。そうした小さな発見がいずれ大きな課題を解決するのです。しかし、論文の最後には大きな最終目標みたいな課題が書いてあって、次人類が取り組むべきでないことが書いてあったりします!この次取り組むべき課題というものを見つけるためには、やはりSurveyを怠ってはいけないのです!
ぜひ、今回伝授した手法を参考に論文を読んでみてください!!
大学院進学とお金の話
今B2の方は来年就活をする人も多いでしょう。一方、院進のため就活をしない!って人や未だ悩んでる人もいると思います。
当然、大学院へ進学するには学費が掛かります!ただ、これで院進を諦めてしまうのは悲しい...
そこで、皆さんにJASSO(日本学生支援機構)の第一種奨学金というものを知ってほしい!
これは学部の奨学金とはことなり、成績や学力の審査なく無利子で借りることができます!無利子なので、基本的に借りるリスクはほぼ0!お金の有無に関わらず、借りることをオススメします!
所得に関して「自身の年収299万以下」という基準だけ有りますが、これは親御さんやご家族の収入は加味されません!実家が太くても借りれます!あなたのバイト代、インターン代が299万行ってなければOK!
さらに注目したいのが、業績優秀者免除というシステムです!これは各大学で研究実績が優秀な人を定めます。つまり、世界的に優秀とカではなく、あくまで学内の同期よりジャーナルを書いたり国際会議に採択されればOK!30%前後の方が半額、または全額免除になっているようです。全額返済免除ともなれば、実質無料で大学院に行けるわけですね!!!研究を頑張ってタダで学位を貰いましょう!
また、この記事はK3 Advent Calendarの記事なので、読者の多くはコンピュータサイエンス分野の人でしょうか?
幸運なことに、コンピュータサイエンスは今の時代、金になります。大学院に行くと就活が苦しくなるなどという言説もありますが、我々の分野に限って言えばそんなことはないでしょう!論文そのものがポートフォリオになるし、周囲の人はちゃんと評価されている印象です。また、リサーチインターン (社員さんにキャリーしてもらいながら研究して論文書くインターン) で働けば、修士、博士の間に研究してるだけで、そこらの社会人より稼げてしまったりします🤑
さらに、研究を頑張っていると、様々なルートで海外の大学で研究をするチャンスが舞い込んできたりするのですが、大抵、大学からお給料が出ます。修士2年の知り合いにアメリカで研究している方がいるのですが、月5, 60万頂いているとか...(いいなー)。英語自体は拙くても、語る内容がある人はそれなりに評価されて、それが直接お金に繋がるのが研究の世界です!別にお金が全てではありませんが、ないよりはあったほうがいい。せっかく研究するなら、是非みんな頑張って優秀な成果を残してほしい。
と、なんだか卑しい話をしてきましたが、研究頑張るとちゃんと学費は回収できるよ!って話でした
あ、あと結構アカデミアの世界、美味しいお肉を奢っていただけます (重要)
最後に
今回、論文の探し方や読み方、大学院進学にまつわるお金の話まで、研究を始める皆さんに役立つ情報を詰め込みました。
初学者にとって論文を探すことや読むことは最初の大きな壁ですが、効率的な方法やツールを知れば、その壁は意外と低くなるものです。特に、AIを活用した論文検索ツールや、読むべきセクションを絞る戦略を取り入れることで、より短時間で多くの知見を得られるようになります。また、批判的な視点を持ちながら読むことで、次の研究のアイデアや課題を見つける力も自然と身についていきます。また、今回紹介した読み方は論文を書くことにもの生かされるはずです。型を知り、読みやすい論文を書きましょう!僕も今執筆頑張ってます
さらに、大学院進学を目指している方には、学費に関する不安を解消する情報や研究を頑張った先にある嬉しい話しについてもお伝えしました。研究は辛いこともありますが、それを乗り越えることで得られるものは大きいです。論文を読み、考え、書き、議論するプロセスの中で、きっと新しい自分の可能性に出会えるはずで
最後に、研究は個人プレイのように見えて、実際は多くの人とのつながりで成り立っています。ぜひ、この記事で紹介したツールや方法を活用しつつ、周りの人たちと協力して、より良い研究成果を目指してください。
あ!今回僕が紹介してない良いツールがありましたら、TwitterのリプかDMで教えてください!!
では、素晴らしい研究ライフを!🎓📚✨