はじめに:本日の読書会について
今日は、「CyberSecurityの論文を読む会」ということでお集まりいただき、誠にありがとうございます。
- 我々としては、スタートアップという位置づけの中で、研究開発を自分たちなりに進めています。
- 今日の読書会も、その延長として開催させていただいています。
まず自己紹介
元々渋谷の弊社でコロナ前に機械学習の論文輪読会やKaggleハッカソンをやっておりました
https://www.team-ai.com/
チーム構成と研究スタイル
我々のチームは、
- コードを書くメンバーが 1 名、
- 数学、それも純粋数学(pure mathematics)の PhD を持つ人が 2 名、
- 社会から問題を持ち込む役割の私、
という構成になっています。
具体的には以下のように進めています。
- 私が社会から問題を持ってくる
- 課題解決をコーディングしてオープンソースライブラリにする
- 数学担当が数式デザインや論理証明を担当
- これらの組み合わせで研究開発を進める
コミュニティでの立ち位置と評価の難しさ
うちは大企業じゃないので、現状課題があります。
-
IT系コミュニティで浮く
- 「なんか難しいことやってますね」以上の反応がなく、シーンとなってしまう
-
純数学系コミュニティ
- 「ITの計算=応用数学だから新規性ないよね」「勝手にやれば?」という扱いになる
自虐的ですが、この “足して2で割った中間領域” こそ我々の価値だと思っているものの、なかなか理解されにくい状況です。
- 領域的にはコンピュータサイエンスの人に近い、いわばハイブリッド
- ただ、チームも小さく、レベルもまだまだ
- 上記謙遜した気持ちでよちよちと、一方誰かの役に立ちたいという情熱は曲げず
過去の活動と今回の再開
もともとは AI の論文を読む会として、2016年から渋谷で「Team AI」という名前で活動していました。
- そのノリで今回の会を再開します
- ここにいらっしゃる皆さんはセキュリティ分野で経験や見識がある方が多いはず
- 私たちが知らないことに詳しい方も多いと思うので、ぜひ教えていただきながら楽しく進めたい
(以上 イントロ)
今日のグループワークについて
今回は試しに、以下のような方法でやってみたいと考えています。
- 二人一組のペアになって助け合いながら読む
- 私は昔から “おもしろい論文を探す” のが得意なので、紹介しながら回る
- 皆さんが平均的に幸せになれる、というのを目指したい
また、以下のような参加の仕方にも対応できます。
- 慣れていない人:調査・整理整頓の作業も非常に面白い
- 最新の新規性を探したい人:そこにフォーカスしてお手伝い可能
初回なのでトライアンドエラーで進めさせていただければと思っています。
生成AIツール(GPT/Gemini/Claude/Groq など)への所感
ご存知の通り、AI 各社は非常に強力です。
- ClaudeはIT系、Codingの知識が豊富
- Chat-GPT は ビジネス分析含めたオールラウンドな頭の良さ
- Gemini(ジェミニ)は 理数系が得意、Notebook LLMも強力
- Groq(グロック)は 結構インディーズな面白い情報くれます。陰謀論モードも楽しい。
- 個性豊かで、それぞれ特徴がまったく違う
- 正直、このあたりのR&Dは我々も本当に助かっている
短めにまとめると、
- 代わりに研究してくれたりもするが、我々は"楽しみはアウトソースしたくない"
- “コリッと着地させる”ために、人間手動で、適宜ブーストや査読に使う
- 示唆や補助としては非常に優秀
量子計算耐性暗号=格子暗号の仕組み調査
我々の最初のきっかけになった問題があります。
- 「耐量子暗号」って
- バウンダリーという意味であいまいでは?
- 「耐える(耐性)ってピンキリでは?」
- 「量子コンピューターってピンキリでは?」
- それを組み合わせた「ピンキリ × ピンキリ」は一体どうなるのか?
(P)マイルストーンペーパーを読む意義
何か問題で決着がつかない時、我々はよく“源流をたどる”アプローチを取ります。
-
格子暗号では、Jil Piperという女性数学者が巨匠です(米国数学協会代表)
- 20年前から量子の概念を議論
- 我々はこれを“マイルストーンペーパー”として扱う
- 数十年経っているので、数学には絶対がない点を気をつけつつ、ほぼ"依拠しても安心できるファクト"としてピン留めし、ここから論理の梯子をかけても安心できる(LLMが確率アウトプットでブレるが、このmilestone paperはブレない = どこまで確証が持てるか可視化しやすくなる)
-
ゼロ知識証明では、Shafi Goldwasser(チューリング賞受賞)
- この人の論文は歴史的マイルストーンとして機能
- 1980年代の論文でもとても分かりやすい
理由としては、
- 最近の論文はキーワードがポップ化して増えすぎている
- 産業的な事情(特許、競合、情報をあえて隠す)が絡むことも多い
- 一方、分野を創った先駆者の論文は「考えたこと全部書いてある」
(Q)2次元マトリクス整理法
最近気に入っている手法です
- 縦横の2グリッドで「明らかにしたいこと」を整理
- 「この項目とこの項目、掛け合わせたらどうなる?」をAIに投げる
- "**ここを埋めて"とセルに入れておく
- GPT / Gemini / Claude などで埋まり方の癖が違うのが面白い
これを何度も繰り返すことで精度が上がっていきます。
- 縦 × 横の 2 次元マトリックス整理は非常に有効
- 量子系の調査もほぼこれでやった
(R) AIによる査読支援の強さ
研究は“着地させる”必要があるため、AIの助け方には注意が必要ですが、査読支援は非常に強力です。
- 例えば
- 「Arxiv.orgに通したいので不足している箇所を20項目指摘して」
- → バーッと出してくれる
- 特に Gemini が強い
- さらに
- その20項目に対し「インパクトの大きさ」「対応のしやすさ」の2軸でスコア化
- その掛け算でソート
- → 論文改善の優先順位が一発でわかる
まとめと本日の進め方
以上、長くなりましたが、こうした背景を踏まえながら本日の会を進められればと思っています。
- 少しずつ話をしながら
- グループワークで助け合いながら
- 楽しくワイワイ読み進めていければ幸いです