0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

llms.txtとは何か:AIに自分のサイトを正しく理解させるファイルの実装ガイド

0
Posted at

llms.txtとは

llms.txtは、ChatGPT、Claude、Perplexityなどの言語モデル向けのrobots.txtに相当するファイルです。robots.txtがGoogleに何をクロールするか伝えるように、llms.txtはLLMにあなたが誰で、何について書いていて、どのページが重要かを伝えます。

サイトのルートに置くプレーンなMarkdownファイルで、https://yoursite.com/llms.txt でアクセスできます。

標準は2024年末に llmstxt.org によって提案されました。まだ公式ではありませんが、Anthropicはすでに自社ドメインに公開しています。OpenAI、Google、Perplexityのクローラーはサイト訪問時に類似のファイルを探しています。

なぜ今実装すべきか

AccuraCast の調査によると、AIエンジンに引用されるページの81%がスキーママークアップを使用しています。llms.txtはスキーマとは別のレイヤーですが、同じ目的を果たします:AIモデルにあなたのサイトのコンテキストを与えることです。

Google Trendsのデータでは、「llms.txt」は2026年に米国と日本の両方でBreakout(急上昇)キーワードになっています。日本語でこのトピックについて書いている人はほぼいません。

実装コストは最小限です。テキストファイル1つ、30分の作業、リスクゼロ。標準が公式に採用された場合、すでに準備完了です。

ファイルの構造

フォーマットはシンプルなルールを持つMarkdownです。

# サイト名

> サイトの説明文。一行で何をしているか伝える。

## Author
- Role: あなたの役割
- Experience: 経験
- Languages: 対応言語

## Topics Covered
- トピック1
- トピック2
- トピック3

## Key Pages
- [ページ名](https://yoursite.com/page): 説明
- [別のページ](https://yoursite.com/other): 説明

重要なルール

  1. H1はサイト名のみ。説明文と同じ行に書かない
  2. 説明文はブロッククォート>)で書く
  3. リンクはMarkdown形式。むき出しのURLは使わない
  4. 英語で書く。AIクローラーは英語で処理するため、コンテンツがどの言語でもllms.txt自体は英語が最も効果的

よくある間違い

# 悪い例:H1と説明文が結合
# My Site - ブログについての説明文がここに長く続く...

# 良い例:H1は名前のみ
# My Site
> ブログについての説明文はブロッククォートで。

# 悪い例:むき出しのURL
- https://mysite.com/about

# 良い例:Markdown形式のリンク
- [About](https://mysite.com/about): サイトについて

実装手順

1. ファイルを作成

テキストエディタで llms.txt を作成し、サイトのルートディレクトリに配置します。

2. サーバー設定(Apache)

PHPベースのサイトでは、ルーターがリクエストをキャッチして404を返す可能性があります。.htaccess に以下を追加します:

# Apacheがファイルを直接配信する(PHPルーターを通さない)
RewriteRule ^llms\.txt$ - [L]

# パブリックアクセスを許可
<Files "llms.txt">
    Require all granted
</Files>

[L] フラグはApacheに処理を停止してファイルをそのまま配信するよう指示します。これがないと、PHPフレームワークやカスタムルーターが "llms.txt" というスラグの記事を探し、見つからずに404を返します。

3. robots.txtに参照を追加

User-agent: *
Sitemap: https://yoursite.com/sitemap.xml
LLMs-Txt: https://yoursite.com/llms.txt

LLMs-Txt ディレクティブは Sitemap と同様に機能します:クローラーへのヒントであり、コマンドではありません。

4. Nginxの場合

location = /llms.txt {
    default_type text/plain;
    alias /var/www/html/llms.txt;
}

バリデーション方法

公式バリデーターはまだ存在しません。最も実用的な方法は、LLMに直接読み取って分析してもらうことです。

ChatGPTに以下のプロンプトを送ります:

Read the file at https://yoursite.com/llms.txt
and analyze if it follows the llmstxt.org standard.
Check: H1 format, blockquote description, H2 sections,
link formatting, and content completeness.
Score it from 1 to 10.

私が自分のファイルを初めて検証した時、H1が説明文と結合しており、リンクがむき出しのURLでした。修正後、10/10のスコアになりました。

実装の実例

私は自分のブログ shinobis.com にllms.txtを実装しました。バニラPHP、MariaDB、WordPressなしの三言語ブログです。

実装から数週間で以下の変化がありました:

  • キーワード「llms txt」がGoogleで4位にランクイン
  • AIモデルがllms.txtの実装について質問された時にコンテンツを引用し始めた
  • ファイルの存在がサイト全体のコンテキスト理解を助けている兆候が見られた

実際のファイルは shinobis.com/llms.txt で確認できます。

また、ゼロから書きたくない場合のために 無料llms.txtジェネレーター も構築しました。ブラウザで直接動作し、いくつかの質問に答えるだけで有効なllms.txtを生成します。

Generative Engine Optimizationとの関係

llms.txtは、Generative Engine Optimization(GEO)と呼ばれる新しい分野の一部です。GEOは、AIモデルがあなたのコンテンツを引用するように構造化する約22の技術的決定のセットです。

llms.txtはサイトレベルのコンテキストを提供します。JSON-LDのKnowledge Graphは各ページレベルの構造を提供します。引用可能なコンテンツの書き方はページ内の情報を抽出可能にします。これらが連携してAIモデルにとっての「信頼できるソース」になります。

Google Trendsのデータでは、「generative engine optimization」は日本で急上昇中です。日本語でGEOについて実装レベルで書いているサイトはほぼ存在しません。

まとめ

llms.txtは、AIモデルにあなたのサイトを正しく理解させるための最もシンプルな方法です。

実装に必要なのは:テキストファイル1つ、サーバー設定2行、robots.txtに1行。合計30分。

最悪の場合、何も起こりません。最良の場合、LLMがこのファイルを探し始めた時にあなたのファイルはすでにそこにあります。Googleが正式にサイトマップを要求する前にサイトマップを持っていたようなものです。

次のSEOの戦場はランキングではない。引用だ。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?