More than 1 year has passed since last update.

【JavaScript】querySelector よりもパワフルに DOM からノードを取得しよう！【XPath】

Last updated at 2024-01-29Posted at 2024-01-26

1. はじめに

これは XPath を利用して DOM からノードを取得する方法を紹介する記事です。

最近 XPath の存在を知り、「XPath を利用して document.querySelector() のように DOM からノード（要素）を取得したい！」と思い立ったため、その方法をまとめていきます。

最近 XPath の存在を知ったばかりの拙いエンジニアによる記事です。誤りや不適切な記述がある場合はご指摘ください。

2. 結論

XPath を利用して DOM からノードを取得する関数です。取得したノードは配列に格納して返却します。

const getNodesByXPath = (xpath) => {
  const result = document.evaluate(
    xpath,
    document,
    null,
    XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,
    null
  );
  return [...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));
};

const nodes = getNodesByXPath('//div');
nodes; // [div, div, div, ...]

3. XPath とは

3.1. 概要

XPath とは XML 文書（HTML 含む）のさまざまなノードを指し示すことができるパス文字列のことです。

XPath は XML Path Language の略称です。非 XML 構文を使って、柔軟な方法で XML 文書の様々な部分をアドレッシングする（指し示す）ことができます。
（中略）
Document.getElementById() や Document.querySelectorAll() メソッドや Node.childNodes プロパティ、その他の DOM コア機能に依存することなく、はるかにパワフルな方法でたどることができます。

3.2. 構文

HTML 内のノードを URL のパスのような表記で指し示します。これをロケーションパスと呼びます。
以下は XPath の一例です。

/html/body/main/div[1]/article/header/h1

これは「html の中の body ノードの中の main ノードの中の１つ目の div ノードの中の article ノードの中の header ノードの中の h1 ノード」を指し示します。一致するノードが複数存在する場合、すべてのノードが対象となります。
以下の CSS セレクタとほとんど同義です¹。

html > body > main > div:first-child > article > header > h1

スラッシュ（/）が1つの場合は子、つまりコンテキストノードの直下にあるノードのみを指し示しますが、2つ重ねることで子孫のすべてのノードを指し示すことができます。以下はその一例です。

/html/body/main//h1

これは「html の中の body ノードの中の main ノードの中のすべての h1 ノード」を指し示します。
以下の CSS セレクタと同義です。

html > body > main h1

スラッシュ2つで始めることにより、ルートノードの子孫すべてを指し示します。特別な指定をしない限り HTML におけるルートノードは html ノードになります。

//h1

これは「html の中のすべての h1 ノード」を指し示します。

3.3. XPath は CSS セレクタよりもはるかにパワフル

ここまで CSS セレクタと比較しながら XPath をみてきましたが、XPath は CSS よりもはるかにパワフルにノードを指し示すことができます。CSS セレクタの完全上位互換と言ってもいいと思います²。

▼ チートシート

どのようなパワフルな機能があるのか、いくつか例をあげていきます。

3.3.1. 特定の子ノードを持つ親ノードの指定

特定のノードを XPath で指定し、その親ノードを指定することができます。
以下は「"dummy-id" という id 属性を持つ li ノードを子要素にもつ ul ノード」を指し示す XPath です。

//ul[li[@id="dummy-id"]]

これは li ノードを自身の直下に持つ ul ノードのみ対象となります。

ルートノードまですべてのノードを遡るには ancestor という軸（Axis）を利用します。
以下は「"dummy-id" という id 属性を持つ liノードの祖先のすべての ul ノード」を指し示す XPath です。

//li[@id="dummy-id"]/ancestor::ul

3.3.2. 特定のノードのひとつ前に隣り合うノードを指定

「ひとつ後ろに隣り合う要素」は CSS セレクタでは隣接セレクタ + で指定可能ですが、「ひとつ前に隣り合う要素」は ~~CSS セレクタでは指定できません。~~

CSS セレクタでも:has(+ #dummy-id) で「ひとつ前に隣り合う要素」の指定が可能でした。@htsign さんにコメントいただき知りました。ありがとうございます。

XPath では preceding-sibling 軸を利用することで指定可能です。

以下は「"dummy-id" という id 属性を持つ div ノードのひとつ前に隣り合う p ノード」を指し示す XPath です。

//div[@id="dummy-id"]/preceding-sibling::p

e.g.

<p>...</p> <!-- ← これ -->
<div id="dummy-id">...</div>

3.3.3. XPath 関数

XPath 関数と呼ばれる関数が用意されており、より高度にノードを探索することができます。

`text()`

text() 関数は、コンテキストノードのテキストノードを指定します。

以下のような HTML があるとします。

<p id="para">詳細は<a href="/">こちら</a>です。</p>

このとき、text() は「詳細は」と「です。」を指し示します。

//p[@id="para"]/text()

`contains()`

contains() 関数は、第1引数の文字列に第2引数の文字列が含まれているかどうかを判定し、論理値 true または false を返します。

以下は class 属性に mt- という文字列を含んだすべての p ノードを指し示します。

//p[contains(@class, "mt-")]

text() 関数と組み合わせることで、「特定の文字列をテキストノードに持つノード」を指し示すことができます。

<p>詳細は担当者にお問い合わせください。</p>
<p>詳細は<a href="/">こちら</a>です。</p>

以下の XPath により、上記2つの p ノードを指し示すことができます。

//p[contains(text(), "詳細は")]

分割された複数のテキストノードを持つ場合

以下のようにテキストノード以外のノードを含んだ p ノードを考えます。

<p>XPath を使用するための主となるインターフェイスは <a href="/document">document</a> オブジェクトの <code>evaluate</code> 関数です。</p>

XPath を使用するための主となるインターフェイスは document オブジェクトの evaluate 関数です。

このとき「オブジェクトの」という文字列を含んだ p ノードを contains() 関数と text() 関数を用いて以下の XPath で取得しようとしても、上記の p ノードは指し示すことができません。

//p[contains(text(), "オブジェクトの")]

一見するとうまくいってそうですが、ダメでした。
text() はコンテキストノードが持つすべてのテキストノードを指し示すことができますが、contains() の第一引数には単一の文字列のみ渡るため text() で得られた最初のテキストノードのみが引数として渡されます。
つまりこの例では「XPath を使用するための主となるインターフェイスは」というテキストノードのみが contains() に渡されるため false 判定となり上記の p ノードは対象外となります。

これを回避してコンテキストノードが持つ複数あるすべてのノードを contains() で判定するためには以下の XPath を利用します。
（@htsign さんにいただいた方法を載せております。ありがとうございます。）

//p[contains(., "オブジェクトの")]

p ノードの子ノードすべてを対象とし、self 軸（.）を利用してすべてのノードに対して contains() で判定しています。これで特定の文字列を子ノードに持つノードを指し示すことができます。
子ノードは contains() に渡される際に暗黙的に型変換されますが、string() 関数を用いて明示的に string 型へと変換してもよいと思います。

//p[contains(string(.), "オブジェクトの")]

~~なおこの XPath は自作なので、よりよい方法がありましたらご指摘いただけるとうれしいです。~~

4. XPath で指し示したノードを JavaScript で取得する

本題です。XPath を利用して DOM からノードを取得します。

JavaScript でノード（要素）を取得するために document.getElementById や document.querySelector などのメソッドが用意されていますが、これらは XPath を指定できないため、別の方法を用いて取得します。いくつか方法はありますが、その中のひとつをご紹介します。

基本的に標準の DOM API で事足りるという前提のもと、XPath を利用したいというニッチな状況の想定です。

以下の手順で取得します。

document.evaluate() を実行して DOM から XPathResult オブジェクトを取得
XPathResult.snapshotItem() メソッドからノードの集合を取得

1. `document.evaluate()` を実行して DOM から `XPathResult` オブジェクトを取得

document.evaluate() メソッドを実行して XPathResult オブジェクトを取得します。
第1引数に XPath、第2引数にコンテキストノードとして document を指定します。特に、第4引数（resultType）に ORDERED_NODE_SNAPSHOT_TYPE または UNORDERED_NODE_SNAPSHOT_TYPE を指定することで、スナップショットを取得します。

const result = document.evaluate(
  xpath,
  document,
  null,
  XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, // or UNORDERED_NODE_SNAPSHOT_TYPE
  null
);

2. `XPathResult.snapshotItem()` メソッドからノードの集合を取得

スナップショットを含んだ XPathResult オブジェクトを取得することにより、XPathResult.snapshotItem() メソッドから取得したノードを取り出すことができます。インデックスを指定することで取り出せるため、すべてのノードを取得するために XPathResult.snapshotLength の数だけループを回し、ノードを配列に格納します。

[...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));

これにて XPath からノードの集合を取得することができました。
以下は汎用的にしたコードです。

const getNodesByXPath = (xpath) => {
  const result = document.evaluate(
    xpath,
    document,
    null,
    XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,
    null
  );
  return [...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));
};

const nodes = getNodesByXPath('//div');
nodes; // [div, div, div, ...]

document.querySelectorAll との実行時間の比較

簡単な測定ではありますが、document.querySelectorAll と実行時間の比較をしてみました。
配列操作をしているためか XPath の方が3倍くらい時間がかかります。

XPath での取得

const startTime = performance.now(); // 開始時間
const nodes = getNodesByXPath('//div');
const endTime = performance.now(); // 終了時間

console.log(endTime - startTime);
// 0.3000001907348633

document.querySelectorAll での取得

const startTime = performance.now(); // 開始時間
document.querySelectorAll('div');
const endTime = performance.now(); // 終了時間

console.log(endTime - startTime);
// 0.09999990463256836

「特定のテキストノードをもつノードのみ取得する」「親ノードを取得する」など、より高度な条件で取得するために filter() や closest() などのメソッドを組み合わせた場合、もしかしたら XPath で取得した方が早くなる可能性もあります。

いずれにせよ、この時間差は人間には知覚できないレベルであることは間違いありません。

5. おわりに

XPath を利用して DOM からノードを取得する方法をまとめました。
document.getElementById や document.querySelector などの標準メソッドだけではどうしてもアドレッシングが難しい、という限定的な状況で輝いてくれる日が来るかもしれません。私はまだないですが。

より厳密には /html は CSS セレクタの html:root と同義となると考えられます。HTML 文書に XML が埋め込まれている場合、「ルート要素の HTML」なのか「埋め込まれた HTML」なのかで挙動が変わります。詳しくは @think49 さんにいただいたコメントをご参照ください。 ↩
「CSS セレクタでできることは XPath でもでき、XPath でできて CSS セレクタにはできないことがある」という意味です。 ↩

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up