1. はじめに
これは XPath を利用して DOM からノードを取得する方法を紹介する記事です。
最近 XPath の存在を知り、「XPath を利用して document.querySelector()
のように DOM からノード(要素)を取得したい!」と思い立ったため、その方法をまとめていきます。
最近 XPath の存在を知ったばかりの拙いエンジニアによる記事です。誤りや不適切な記述がある場合はご指摘ください。
2. 結論
XPath を利用して DOM からノードを取得する関数です。取得したノードは配列に格納して返却します。
const getNodesByXPath = (xpath) => {
const result = document.evaluate(
xpath,
document,
null,
XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,
null
);
return [...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));
};
const nodes = getNodesByXPath('//div');
nodes; // [div, div, div, ...]
3. XPath とは
3.1. 概要
XPath とは XML 文書(HTML 含む)のさまざまなノードを指し示すことができるパス文字列のことです。
XPath は XML Path Language の略称です。非 XML 構文を使って、柔軟な方法で XML 文書の様々な部分をアドレッシングする(指し示す)ことができます。
(中略)
Document.getElementById()
やDocument.querySelectorAll()
メソッドやNode.childNodes
プロパティ、その他の DOM コア機能に依存することなく、はるかにパワフルな方法でたどることができます。
3.2. 構文
HTML 内のノードを URL のパスのような表記で指し示します。これをロケーションパスと呼びます。
以下は XPath の一例です。
/html/body/main/div[1]/article/header/h1
これは「html の中の body ノードの中の main ノードの中の 1つ目の div ノードの中の article ノードの中の header ノードの中の h1 ノード」を指し示します。一致するノードが複数存在する場合、すべてのノードが対象となります。
以下の CSS セレクタとほとんど同義です1。
html > body > main > div:first-child > article > header > h1
スラッシュ(/
)が1つの場合は子、つまりコンテキストノードの直下にあるノードのみを指し示しますが、2つ重ねることで子孫のすべてのノードを指し示すことができます。以下はその一例です。
/html/body/main//h1
これは「html の中の body ノードの中の main ノードの中のすべての h1 ノード」を指し示します。
以下の CSS セレクタと同義です。
html > body > main h1
スラッシュ2つで始めることにより、ルートノードの子孫すべてを指し示します。特別な指定をしない限り HTML におけるルートノードは html
ノードになります。
//h1
これは「html の中のすべての h1 ノード」を指し示します。
3.3. XPath は CSS セレクタよりもはるかにパワフル
ここまで CSS セレクタと比較しながら XPath をみてきましたが、XPath は CSS よりもはるかにパワフルにノードを指し示すことができます。CSS セレクタの完全上位互換と言ってもいいと思います2。
▼ チートシート
どのようなパワフルな機能があるのか、いくつか例をあげていきます。
3.3.1. 特定の子ノードを持つ親ノードの指定
特定のノードを XPath で指定し、その親ノードを指定することができます。
以下は「"dummy-id"
という id 属性を持つ li ノードを子要素にもつ ul ノード」を指し示す XPath です。
//ul[li[@id="dummy-id"]]
これは li ノードを自身の直下に持つ ul ノードのみ対象となります。
ルートノードまですべてのノードを遡るには ancestor
という軸(Axis)を利用します。
以下は「"dummy-id"
という id 属性を持つ liノードの祖先のすべての ul ノード」を指し示す XPath です。
//li[@id="dummy-id"]/ancestor::ul
3.3.2. 特定のノードのひとつ前に隣り合うノードを指定
「ひとつ後ろに隣り合う要素」は CSS セレクタでは隣接セレクタ +
で指定可能ですが、 「ひとつ前に隣り合う要素」は CSS セレクタでは指定できません。
CSS セレクタでも:has(+ #dummy-id)
で「ひとつ前に隣り合う要素」の指定が可能でした。@htsign さん に コメントいただき 知りました。ありがとうございます。
XPath では preceding-sibling
軸を利用することで指定可能です。
以下は「"dummy-id"
という id 属性を持つ div ノードのひとつ前に隣り合う p ノード」を指し示す XPath です。
//div[@id="dummy-id"]/preceding-sibling::p
<p>...</p> <!-- ← これ -->
<div id="dummy-id">...</div>
3.3.3. XPath 関数
XPath 関数と呼ばれる関数が用意されており、より高度にノードを探索することができます。
text()
text()
関数は、コンテキストノードのテキストノードを指定します。
以下のような HTML があるとします。
<p id="para">詳細は<a href="/">こちら</a>です。</p>
このとき、text()
は「詳細は」と「です。」を指し示します。
//p[@id="para"]/text()
contains()
contains()
関数は、第1引数の文字列に第2引数の文字列が含まれているかどうかを判定し、論理値 true
または false
を返します。
以下は class 属性に mt-
という文字列を含んだすべての p ノードを指し示します。
//p[contains(@class, "mt-")]
text()
関数と組み合わせることで、「特定の文字列をテキストノードに持つノード」を指し示すことができます。
<p>詳細は担当者にお問い合わせください。</p>
<p>詳細は<a href="/">こちら</a>です。</p>
以下の XPath により、上記2つの p ノードを指し示すことができます。
//p[contains(text(), "詳細は")]
分割された複数のテキストノードを持つ場合
以下のようにテキストノード以外のノードを含んだ p ノードを考えます。
<p>XPath を使用するための主となるインターフェイスは <a href="/document">document</a> オブジェクトの <code>evaluate</code> 関数です。</p>
XPath を使用するための主となるインターフェイスは document オブジェクトの
evaluate
関数です。
このとき「オブジェクトの」という文字列を含んだ p ノードを contains()
関数と text()
関数を用いて以下の XPath で取得しようとしても、上記の p ノードは指し示すことができません。
//p[contains(text(), "オブジェクトの")]
一見するとうまくいってそうですが、ダメでした。
text()
はコンテキストノードが持つすべてのテキストノードを指し示すことができますが、contains()
の第一引数には単一の文字列のみ渡るため text()
で得られた最初のテキストノードのみが引数として渡されます。
つまりこの例では「XPath を使用するための主となるインターフェイスは」というテキストノードのみが contains()
に渡されるため false
判定となり上記の p ノードは対象外となります。
これを回避してコンテキストノードが持つ複数あるすべてのノードを contains()
で判定するためには以下の XPath を利用します。
(@htsign さん に いただいた方法 を載せております。ありがとうございます。)
//p[contains(., "オブジェクトの")]
p ノードの子ノードすべてを対象とし、self 軸(.
) を利用してすべてのノードに対して contains()
で判定しています。これで特定の文字列を子ノードに持つノードを指し示すことができます。
子ノードは contains()
に渡される際に暗黙的に型変換されますが、string()
関数を用いて明示的に string 型へと変換してもよいと思います。
//p[contains(string(.), "オブジェクトの")]
なおこの XPath は自作なので、よりよい方法がありましたらご指摘いただけるとうれしいです。
4. XPath で指し示したノードを JavaScript で取得する
本題です。XPath を利用して DOM からノードを取得します。
JavaScript でノード(要素)を取得するために document.getElementById
や document.querySelector
などのメソッドが用意されていますが、これらは XPath を指定できないため、別の方法を用いて取得します。いくつか方法はありますが、その中のひとつをご紹介します。
基本的に標準の DOM API で事足りるという前提のもと、XPath を利用したいというニッチな状況の想定です。
以下の手順で取得します。
-
document.evaluate()
を実行して DOM からXPathResult
オブジェクトを取得 -
XPathResult.snapshotItem()
メソッドからノードの集合を取得
1. document.evaluate()
を実行して DOM から XPathResult
オブジェクトを取得
document.evaluate()
メソッドを実行して XPathResult
オブジェクトを取得します。
第1引数に XPath、第2引数にコンテキストノードとして document
を指定します。特に、第4引数(resultType
)に ORDERED_NODE_SNAPSHOT_TYPE
または UNORDERED_NODE_SNAPSHOT_TYPE
を指定することで、スナップショットを取得します。
const result = document.evaluate(
xpath,
document,
null,
XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, // or UNORDERED_NODE_SNAPSHOT_TYPE
null
);
2. XPathResult.snapshotItem()
メソッドからノードの集合を取得
スナップショットを含んだ XPathResult
オブジェクトを取得することにより、XPathResult.snapshotItem()
メソッドから取得したノードを取り出すことができます。インデックスを指定することで取り出せるため、すべてのノードを取得するために XPathResult.snapshotLength
の数だけループを回し、ノードを配列に格納します。
[...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));
これにて XPath からノードの集合を取得することができました。
以下は汎用的にしたコードです。
const getNodesByXPath = (xpath) => {
const result = document.evaluate(
xpath,
document,
null,
XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,
null
);
return [...Array(result.snapshotLength)].map((_, i) => result.snapshotItem(i));
};
const nodes = getNodesByXPath('//div');
nodes; // [div, div, div, ...]
document.querySelectorAll との実行時間の比較
簡単な測定ではありますが、document.querySelectorAll
と実行時間の比較をしてみました。
配列操作をしているためか XPath の方が3倍くらい時間がかかります。
const startTime = performance.now(); // 開始時間
const nodes = getNodesByXPath('//div');
const endTime = performance.now(); // 終了時間
console.log(endTime - startTime);
// 0.3000001907348633
const startTime = performance.now(); // 開始時間
document.querySelectorAll('div');
const endTime = performance.now(); // 終了時間
console.log(endTime - startTime);
// 0.09999990463256836
「特定のテキストノードをもつノードのみ取得する」「親ノードを取得する」など、より高度な条件で取得するために filter()
や closest()
などのメソッドを組み合わせた場合、もしかしたら XPath で取得した方が早くなる可能性もあります。
いずれにせよ、この時間差は人間には知覚できないレベルであることは間違いありません。
5. おわりに
XPath を利用して DOM からノードを取得する方法をまとめました。
document.getElementById
や document.querySelector
などの標準メソッドだけではどうしてもアドレッシングが難しい、という限定的な状況で輝いてくれる日が来るかもしれません。私はまだないですが。