何度も使いそうなのでメモ
laiso/site2pdf at blog.lai.so
複数ページに渡るドキュメントなどでこの使用します。
基本の使い方
PDF化したいサイトのURLをメモ
npx site2pdf-cli "メモしたURL"
実行例
今回はDrizzle ORMのドキュメントをPDFファイルにします。
Drizzle ORMを訪れます。
Drizzle ORM - next gen TypeScript ORM.
https://orm.drizzle.team/
ドキュメントのページを開きます。
Drizzle ORM - Why Drizzle?
https://orm.drizzle.team/docs/overview
このDrizzleのドキュメントを開くと、overview(概要欄)ページが開きます。
このままでは概要欄ページだけがPDFファイルになるので
ドキュメント全体をPDFファイルにするために
https://orm.drizzle.team/docs/overview
を
https://orm.drizzle.team/docs/
と編集します。
PDFファイルを出力したいフォルダを開き、そこでコマンドを実行します。
> npx site2pdf-cli "https://orm.drizzle.team/docs/"
Generating PDF for https://orm.drizzle.team/docs/ and sub-links matching /^https:\/\/orm.drizzle.team\/docs\//
loading https://orm.drizzle.team/docs/
(省略)
Generated PDF for https://orm.drizzle.team/docs/typebox
PDF saved to C:\Users\[ユーザー名]\Documents\supabase\out\orm-drizzle-team-docs.pdf
👆️省略部分には読み込みページの一覧が表示されています。
「outのフォルダ」が作られそこに "orm-drizzle-team-docs.pdf"というファイル名で出力されます。
PostgreSQLなどはPDFが用意されていたのですが、他は見かけなかったのでツールを使いました。
NotebookLMに読み込ませるにはPDF形式が良いだろうとこのツールを選びました。