Google Apps ScriptでHTMLをパースする3つの方法

Last updated at 2025-05-29Posted at 2025-05-29

Google Apps Script（GAS）でHTMLを扱う場面では、いくつかのパース方法があり、バイブコーディング中にどの手法を使うか迷うことがありました。
そこで今回は、備忘録も兼ねて、代表的な3つの方法を比較し、それぞれのメリット・デメリットや使いどころを整理してみます。

1. XmlServiceを使う方法

GAS標準の XmlService.parse() を使って、HTMLをDOMライクに解析する方法です。

const xml = XmlService.parse('<root>' + cleanedHtml + '</root>');

タグ構造を正規表現で解析し、必要なテキストや属性を抽出する方法です。

const match = html.match(/<td[^>]*>\s*(\d{4}\/\d{2}\/\d{2})/);

GAS用のCheerioラッパーライブラリ「cheeriogs」を使って、jQueryのようにHTMLを解析する方法です。

const $ = Cheeriogs.load(html);
const store = $('td').eq(1).text();

特徴 / 方法	XmlService	正規表現	cheeriogs
HTMLの構文厳密性	必須（XHTML準拠）	不要	不要
構造変更への強さ	強い（DOMベース）	弱い（壊れやすい）	中程度（セレクタ次第）
実装のシンプルさ	△ 前処理が必要	◎ すぐに使える	○ 導入が必要
保守性・読みやすさ	△ XML風で冗長	△ 複雑になることも	◎ jQuery風で直感的
向いているHTML	整形されたXML風HTML	DOM構造が固定のHTML	ネストや繰り返し構造
外部ライブラリの依存	なし	なし	あり