前提
データサイエンティストとして論文実装などを行なってきており、その際に用いる情報収集源を書いた記事です。
論文は読みますが、大学などの研究施設で研究をこなしていたわけではないです。
論文のリサーチ方法
まずやりたいタスクについて自然言語検索サービスで検索します。
使用ツールは以下です。
- GeminiのDeepResearch
これはGeminiではなくてChatGPTでも構いません。 - XのGrok
上記でWebとXの情報の両方を得られます。
リサーチャーはなんだかんだ最終的にXに回帰しまいますね。。。
自然言語検索についてはElicitを元々使用していましたが、上記のようなツールが出てきたおかげでお役御免となりました。
もちろん自然言語以外の検索もします。
使用ツールは以下です。
- Google Scholar
- Xでの通常の検索
また、タスク、データセットでSoTAなサービスを調べる際は、
Paper with Codeも用います。
上記のツールで見つけた論文についてConnected Papersで関連論文を調べていきます。
上記のように調べていきますが、もちろん状況に応じて柔軟に色々なツールを使い分けます。
見つけた論文のモデルについて、
Hugging FaceやGithubでどれだけいいねがあるかは参考にします。
カンファレンスランク
なんかも参考にします。
論文リサーチに時間をかけすぎてもあれなので、ランク5,6番目までのものまで読むことが多いです。
トレンドのリサーチ
松尾研のリサーチャーである小川雄太郎様が書かれた以下のサイトが参考になります。
https://zenn.dev/mkj/articles/1357a7ea2970c4
私は経営に携わるような立場には及ばないこと、まだ自分の力を磨くためには1次情報にできるだけあたる必要があると思い、上記のリンクのうち日経ビジネス、ITMediaなどの社会情勢についての情報源、Zennやはてなブログのトレンド情報、生成AIウィークリーなどは見ていません。
日経クロステックぐらいはエンジニアとして世間に疎くなりすぎたらいけないので見ています。
以下のように日々の確認効率化を図っています。
Gmailのラベル振り分け機能で「情報収集」というラベルをつけて振り分けています。この際に受信トレイをスキップ(アーカイブする)にチェックを入れると受信トレイにメールがたまらずにすみますのでオススメです。
また、ブラウザArcのフォルダ機能を使って簡単に確認できるようにしています。
まとめ
トレンドのリサーチは朝時間ある時に行うようにしていますが、正直できないことの方が多いです。
神経質にならないことが大事だと思います。
最後にまだ駆け出しエンジニアですの、皆さんがどのようにしているかもお聞かせいただけますと幸いです。