はじめに
私たちリンカーズは、製造業や金融機関向けの企業同士を繋げるマッチングサービスや、技術動向を調査するリサーチサービスを開発・運営しています。
先日プレスリリースを出させていただいた「Linkers TX」では、シーズを持つ企業・研究者と、ニーズを持つ企業をつなぐというサービスの性質上、企業の情報や技術的な文書(論文・特許)など、自然言語で記述された情報を扱うことも多く、自然言語処理を用いた開発を行っています。
今回、2026年3月に宇都宮で開催された言語処理学会第32回年次大会(NLP2026)に初めてスポンサーとして参加し、ブース出展も行いました。2,200人超の研究者・技術者が集まるこの場で感じたことをレポートとしてお届けします。
NLP2026について
言語処理学会年次大会は、自然言語処理(NLP)を対象とする国内最大規模の学術カンファレンスです。毎年3月に開催され、今年はライトキューブ宇都宮を会場に、3月9日(月)〜13日(金)の5日間にわたって開催されました。

図1: 2日目の朝、雪が降るライトキューブ宇都宮
今年の規模感はこちらです。
- 参加者(事前・直前登録):2,236人(当日参加を含めると過去最多)
- 発表件数:797件(過去最多)
- スポンサー数:100団体、うちブース出展は64団体
発表件数の増加を受け、基本は「ポスター発表」となり口頭発表は限定的に行われました。具体的には、90分のセッションが9回、1回のセッションでポスター発表が100~120件並行して発表される形式です。
会場を歩き回りながら気になる発表を自由に覗くスタイルで、実際にその研究をされているご本人からお話を聞きつつ、その場で直接質問もできてしまうため、予稿集を読むだけでは得られない「臨場感」が特徴的でした。
ブース出展の様子
今年は初めてブース出展を行い、会社のロゴを模したカラビナをノベルティとしてご用意させていただき、さまざまな方々とお話しさせていただきました。
具体的には、直接的に私たちのサービスに興味を持ってくださった方々、産学連携を推進する中でパートナー探索に困っているといったご意見、またブースのデザインにご興味を持ってくださる方など、日頃接点がない方々も多く、刺激になりました。
当日、お話いただいた皆様、ありがとうございました。
今年の傾向
発表タイトルをLLMに入力しておおまかな傾向を見てみたものが次のとおりです。LLMの出力であること、件数の合計が795件と整合していないことなどから、ご参考までにご覧ください。
まず、「評価・ベンチマーク」が最多なのが印象的です。新しいモデルが次々と登場する中、既存のベンチマークの評価値が飽和してしまったり、日本語固有の問題・多様な応用先のドメインにおいてどのように評価するか、という課題感やそこへの取り組みが見えてきます。
また、次いで多いのがモデルの内部動作の解明に関するものです。引き続きLLMの内部動作や動作原理については不透明なところが多く、モデル自体の改善のみならず、特徴をとらえて利用していく上でも非常に重要な分野です。
| クラスタ名 | 件数 | 一言説明 | 主なキーワード |
|---|---|---|---|
| LLM評価・ベンチマーク | 148件 | LLMの能力を測る評価指標・データセット・ベンチマークの設計・構築に関する研究 | 性能評価・各種ベンチマーク構築 |
| 内部解析・学習手法・アーキテクチャ | 142件 | モデルの内部動作の解明と、学習アルゴリズム・アーキテクチャの改善を扱う研究 | Attention解析・Probing・LoRA・MoE・拡散言語モデル・DPO・GRPO・事前学習・ファインチューニング |
| 対話システム・音声処理 | 112件 | 人とAIの自然な対話実現を目指し、音声認識・合成・対話制御を横断的に扱う研究 | 音声対話・対話コーパス・ターンシフト・音声認識・音声合成・感情・方言音声・対話エージェント |
| マルチモーダル・VLM | 97件 | テキストと画像・映像・音声を統合的に処理する視覚言語モデルの構築と評価に関する研究 | VLM・CLIP・視覚言語モデル・文書画像QA・漫画翻訳・縦書き・医療VLM |
| テキスト表現・情報検索・RAG | 91件 | 文の意味を数値表現に変換し、類似検索・知識拡張検索(RAG)へ応用する研究 | 文埋め込み・RAG・Graph RAG・知識グラフ・ベクトル検索・類似度・トピック抽出・検索モデル |
| 専門ドメイン応用(医療・法・金融・農業等) | 83件 | 医療・法律・金融・農業などの実務領域にNLP技術を適用・実装する応用研究 | 医療テキスト・法令・ESG・特許・農業・契約書・有価証券報告書・カルテ |
| 安全性・バイアス・ファクトチェック | 73件 | LLMの有害出力・偏り・誤情報を検出・抑制し、安全で公平な利用を実現する研究 | ガードレール・ジェイルブレイク・レッドチーミング・アライメント・ハルシネーション検出・バイアス・偽情報 |
| 言語学・コーパス・機械翻訳・教育 | 49件 | 言語理論・言語資源の整備と、翻訳・言語教育への応用を扱う基礎〜応用研究 | サプライザル・CCG・語彙・方言・コーパス構築・機械翻訳・NLP教育・言語習得・第二言語学習 |
ちなみに、参加者・発表者数の増加傾向を見ると、ChatGPTが登場した直後のNLP2024以降大幅な伸びが続いていたのですが、今年度の伸びは小幅であり、一旦は落ち着いてきた印象もあります。
いくつかの発表内容のご紹介
非常に多くのポスターが同時並行で発表されていたため、なかなか全部を聴ききれていませんが、いくつか目に止まった発表内容を共有いたします。
B9-15: 日本語 LLM は内部でどの表記を経由するか:logit lens による潜在的漢字化の分析
様々なLLMに「カタカナを入力 → ひらがなを出力」するタスクを解かせた時の内部出力をlogit lens(各層の出力をデコードして可視化する手法)で見たときに、モデルにより内部の挙動が異なる、という研究です。
具体的に、1.英語を中心に学習されたモデル、2.それに対し、日本語で継続学習したモデル、3.日本語データでスクラッチから学習したモデルを比較しています。結果、1. 2.は入力層付近から後半に至るまでは英字が出力され最終層付近でようやくひらがなが出力される一方、3.については、漢字やカタカナトークンが出力されたのち、最終層付近でひらがなが出力されるというように、潜在的に漢字を経由して処理されている傾向が見えるとのことでした。
P2-17: 長文脈LLMによるゼロショット文書ランキングにおけるランキング手法とモデル規模が有効性・効率性に与える影響
LLMを用いてRe-rank(検索結果の順序を再評価して並び替えすること)する際、一般的にはコンテキスト長の制約により、多くの文書のうち、例えば3件の文書をずらしながら(Sliding Window)入力し、その順序を並び替える、ということが実施されます。
この研究では、より長いコンテキストを扱える、Long Context Modelに全ての文書を入力した際、一度に全てを並び替える(listwise)か、全てを入力した上でそれぞれの文書に点数をつけさせる(pointwise)か、を比較したものです。実験した範囲では、baselineとなるSliding Windowの精度がよく、次いで、listwiseという結論でした。一方Sliding Windowは何度も処理する必要があるため、計算時間の面で、Long Context Modelが効率的であるとの結論でした。
私たちのサービスでもより適合した企業を探す、という点においてはランキングに相当する処理を行うため、非常に参考になる発表でした。
P2-21: Deep Research Agentはタスクの進捗を推定できるのか?
Deep Research Agentにおいて、リサーチを行うにあたりどれだけの量の情報が取得できれば、目的となるリサーチを達成するのに「充分」かを判断するのは難しい問題です。私たちの業務でもリサーチを行うシステム開発を行っており、確かに難しい問題であると感じます。
この研究では、進捗状況を予測するタスクを定式化した上で、1.履歴を元に直接数値評価する、2.履歴を元にチェックリストで評価する、3.レポートと新たな観測を入力して評価する、3つの手法を評価し、タスクによるものの手法1が意外にも精度が良かった、という結論でした。
Q5-5: JAPAS: 日本語特許サポート要件抽出のためのベンチマーク
特許を分析する上で、請求項に対して、明細書の対応する内容を特定した上で請求項を十分に説明しているか検証することは重要な問題です。
この研究では、請求項に対応する明細書の範囲を特定した上で、1.それ自体・言い換え(itself)、2.定義・詳細な説明(description)、3.実施例・変形例(example)のラベルをつけたデータセットを作成し、モデルを学習・評価し、スパン抽出の精度がF1で0.5程度と依然として難しいタスクである、という結論でした。
特許の請求項は特有な表現で記述されることが多く、それ自体では解釈したり情報を得るのが難しいのですが、明細書ではより自然な記述がなされているため、請求項に関するより深い分析を行う上では有用な手段だと感じました。
さいごに
宇都宮ということで、どうしても欠かせないのが餃子ですが、個人的なお気に入りは「宮みらい店」限定とされる「豆乳タンタンスープ餃子」でした(限定に弱いだけかもしれません)。

図4: 豆乳タンタンスープ餃子
日常的な業務にもLLMが自然と溶け込んできた昨今、研究・開発において単に適用してみたレベルを超えて、LLMを使ってどのように自然言語を扱っていくか、そこからどのような価値を生み出していくかがより一層求められています。
今後もNLPerのコミュニティとの積極的な交流を通し、社会的な価値実現に繋げていければと改めて思う一週間でした。
リンカーズでは一緒に働く仲間を募集しています。ご興味のある方はぜひご覧ください。

