Edited at

Puppeteer をDockerコンテナで利用する

More than 1 year has passed since last update.

Webサイトのスクリーンショットを取るCLIツールsite-checkerを作った。

インストール方法を書いていて、「Node.jsのvX.X.X以上をインストールして下さい」というのも今日的ではないなぁと感じて、実行環境のバージョンを気にせず利用できるようDockerイメージも用意した。その際、ちょっと引っかかったことを書く。


利用バージョン


Dockerfileの作成

最終的に作成したDockerfileは次の通り。

FROM node:8.4

MAINTAINER HeRoMo

RUN echo 'deb http://ftp.jp.debian.org/debian jessie-backports main' >> /etc/apt/sources.list
RUN set -ex; \
apt-get update; \
apt-get install -y --no-install-recommends \
gconf-service \
libasound2 \
libatk1.0-0 \
libc6 \
libcairo2 \
libcups2 \
libdbus-1-3 \
libexpat1 \
libfontconfig1 \
libgcc1 \
libgconf-2-4 \
libgdk-pixbuf2.0-0 \
libglib2.0-0 \
libgtk-3-0 \
libnspr4 \
libpango-1.0-0 \
libpangocairo-1.0-0 \
libstdc++6 \
libx11-6 \
libx11-xcb1 \
libxcb1 \
libxcomposite1 \
libxcursor1 \
libxdamage1 \
libxext6 \
libxfixes3 \
libxi6 \
libxrandr2 \
libxrender1 \
libxss1 \
libxtst6 \
ca-certificates \
fonts-liberation \
libappindicator1 \
libnss3 \
lsb-release \
xdg-utils \
wget \
fonts-noto-cjk

RUN yarn global add site-checker

RUN mkdir -p /output
WORKDIR /output
ENV NO_SANDBOX=true
ENTRYPOINT [ "site-checker" ]
CMD [ "-h" ]

この内容になる前に次の3点の問題が発生した。


  • Puppeteerのインストールでエラーが発生

  • Chromeが起動できない

  • 日本語の文字が化ける

これらについて以下に述べる。


Puppeteerのインストールでエラーが発生

Puppeteerリポジトリのtroubleshooting.mdに依存パッケージの一覧があるのでそれらをapt-getでインストールする。そして、RUN npm install -g site-checker すれば良いと思ったのだが、ここで次のようなエラーが発生した。

> puppeteer@0.10.2 install /usr/local/lib/node_modules/site-checker/node_modules/puppeteer

> node install.js

fs.js:891
return binding.mkdir(pathModule._makeLong(path),
^

Error: EACCES: permission denied, mkdir '/usr/local/lib/node_modules/site-checker/node_modules/puppeteer/.local-chromium'
at Object.fs.mkdirSync (fs.js:891:18)
at Object.downloadRevision (/usr/local/lib/node_modules/site-checker/node_modules/puppeteer/utils/ChromiumDownloader.js:97:10)
at Object.<anonymous> (/usr/local/lib/node_modules/site-checker/node_modules/puppeteer/install.js:33:12)
at Module._compile (module.js:573:30)

at Object.Module._extensions..js (module.js:584:10)
at Module.load (module.js:507:32)
at tryModuleLoad (module.js:470:12)
at Function.Module._load (module.js:462:3)
at Function.Module.runMain (module.js:609:10)
at startup (bootstrap_node.js:158:16)
npm info lifecycle puppeteer@0.10.2~install: Failed to exec install script
npm ERR! code ELIFECYCLE
npm ERR! errno 1
npm ERR! puppeteer@0.10.2 install: `node install.js`
npm ERR! Exit status 1
npm ERR!
npm ERR! Failed at the puppeteer@0.10.2 install script.
npm ERR! This is probably not a problem with npm. There is likely additional logging output above.

npm installがダメなら、RUN yarn global add site-checker にしてみようと試すと、インストールに成功した。


Chromeが起動できない

イメージのビルドには成功して、次のように実行した。

docker run --rm -v $(pwd):/output:rw site-checker -u http://qiita.com/

すると次のようなエラーが発生した。

Error: Failed to launch chrome!

[0907/150437.316459:ERROR:zygote_host_impl_linux.cc(88)] Running as root without --no-sandbox is not supported. See https://crbug.com/638180.

TROUBLESHOOTING: https://github.com/GoogleChrome/puppeteer/blob/master/docs/troubleshooting.md

at Interface.onClose (/usr/local/share/.config/yarn/global/node_modules/puppeteer/lib/Launcher.js:142:14)
at emitNone (events.js:110:20)
at Interface.emit (events.js:207:7)
at Interface.close (readline.js:367:8)
at Socket.onend (readline.js:147:10)
at emitNone (events.js:110:20)
at Socket.emit (events.js:207:7)
at endReadableNT (_stream_readable.js:1059:12)
at _combinedTickCallback (internal/process/next_tick.js:138:11)
at process._tickCallback (internal/process/next_tick.js:180:9)

「Running as root without --no-sandbox is not supported.」と書いてあるので、rootでないユーザで実行してみたが、それでもエラーが発生する。

troubleshooting.mdを見よと示されているので参照すると、「try running without the sandbox」と書いているので、従うことにする。

Chromeを起動するときに次のように引数を与えれば良いらしい。

const browser = await puppeteer.launch({args: ['--no-sandbox', '--disable-setuid-sandbox']});

troubleshooting.md には--no-sandboxでの実行はセキュリティ的に推奨しないと書かれているが、Dockerコンテナの中なので割り切ることとした。

環境変数NO_SANDBOXで切り替えられるようにツールの実装を変更して対応した。


日本語の文字が化ける

なんとか動くようになったものの、日本語のサイトのスクリーンキャプチャを取ると次のように日本語が表示できなかった。

capture_00000s.png

日本語を表示できるフォントがイメージにインストールされてないからなのねと思い至り、Google Noto Fontsのインストールを追加した。

Nodeの公式イメージのOSであるdebian jessieのパッケージリポジトリにはないため、次のようにリポジトリを追加してapt-getでインストールした。

RUN echo 'deb http://ftp.jp.debian.org/debian jessie-backports main' >> /etc/apt/sources.list

すると次のように見事表示されるようになった。

capture_00000s.png