これは「TeX & LaTeX Advent Caleandar 2020」の23日目の記事です。
22日目は、MusicDumpさんでした。24日目は、7danmoroboshiさんです。
みなさん、#テフライブ! していますか?
ここ最近、「Markdown原稿からPandocしてLaTeX組版する」一連の処理で、書籍製作することが増えてきました。
例えば、某弊社で製作させていただきました事例をいくつかあげます。
- Andriy Burkov[著]、清水美樹[訳] 『機械学習 100+ページ エッセンス』(インプレス)
- David Thomas・Andrew Hunt[著]、村上雅章[訳] 『達人プログラマー 熟達に向けたあなたの旅(第2版)』(オーム社)
- 内田智史[監修]、株式会社システム計画研究所[編] 『C言語によるプログラミング -基礎編-(第3版)』(オーム社)
- 田中祥平[著]『Web配信の技術―HTTPキャッシュ・リバースプロキシ・CDNを活用する』(技術評論社)
- 仙塲大也[著]『良いコード/悪いコードで学ぶ設計入門―保守しやすい 成長し続けるコードの書き方』(技術評論社)
- 手島拓也,吉田健人,高林佳稀[著]『TypeScriptとReact/Next.jsでつくる 実践Webアプリケーション開発』(技術評論社)
- 林 昌吾[著]『実践Redis入門 技術の仕組みから現場の活用まで』(技術評論社)
- 伊藤康太[著]『実践Node.js入門―基礎・開発・運用』(技術評論社)
-
真鍋知博、社本秀之、井関洋平、鈴木翔吾[著]『機械学習による検索ランキング改善ガイド
―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善』(オライリー・ジャパン) - 山田明憲[著]『Docker/Kubernetes実践コンテナ開発入門 改訂新版』(技術評論社)
- 服部佑樹[著]『コード×AIーソフトウェア開発者のための生成AI実践入門』(技術評論社)
- 清水智公[著]『Rustで学ぶWebAssembly――入門からコンポーネントモデルによる開発まで』(技術評論社)
この記事では、この一連の処理による書籍製作を簡単にした形で紹介したい1と思います。
よくある「Markdown原稿からPandocしてLaTeX組版する」例は……、
各章ごとにMarkdown原稿ファイルch01.md, ch02.md, ch03.md, …などを用意して、Pandoc対応しているbxjsclassesのクラスファイルを用いて、必要なオプションをどかっと付けてpandocコマンドを実行する感じだと思います。
さらに、Markdown原稿ファイルのヘッダに header-includes: 〈実質的に、親LaTeX文章ファイルのプリアンブル部分〉
を書いて、いろいろと拡張している例も見かけます。
GistにTeX & LaTeX Advent Caleandar 2020 23日目の例 として、簡単な例を上げました。
Unix系のコマンドラインからbuild1.sh
を実行します。つまり、
$ pandoc -o book.pdf --pdf-engine=lualatex \
-V papersize=a5 -V documentclass=bxjsbook -V classoption=pandoc \
-V indent=1zw \
--number-sections \
--from=markdown+ignore_line_breaks --to=latex \
--toc --strip-comments \
--top-level-division=chapter --standalone \
chpre.md ch01.md ch02.md ch03.md chpost.md
この方法の長所は、LaTeXによるマークアップやLaTeX組版ごとをあまり知らなくても、ある程度いい感じでMarkdown形式からPDFへしてくれます。
(最終的に、LaTeXでいろいろと行うにしても、)Markdown形式でサクッと原稿を草稿するのに、十分に使えますね。
一方、この方法の短所は、文章構成や組版などの制御などなど、アレコレ細かい組版をやるとすると、結局LaTeX事がいろいろと必要になります。前述の header-includes:
にアレコレ書いているのは、LaTeX事のアレコレですので。
2. 「Markdown原稿からPandocしてLaTeX組版する」一連の処理
「Markdown原稿からPandoc経由してLaTeX形式へ変換して、そのままLaTeXで自動組版してPDFを生成する」処理で、最終的にLaTeX組版でアレコレやる前提だったら、はじめからLaTeX組版を前提としたデータ構成にしてしまえばよいと思います。
そこで、某弊社では、以下のようにして「Markdown原稿からPandocしてLaTeX組版する」一連の処理をしています。
- Pandocは、各章ごとのMarkdown原稿(Pandocで変換可能な変換元文章)をシンプルなLaTeX形式へ変換するだけの変換器としてのみ利用する。
- 親LaTeX文章ファイルを用意して、Pandocで変換した各章ごとLaTeX文章ファイルを子ファイルとして
\include
する。 - LaTeX事をプリアンブル(通例書籍専用のクラスファイル)にまとめて、使いたい組版エンジンでタイプセットし、PDFを生成する。
前節と同じ例 TeX & LaTeX Advent Caleandar 2020 23日目の例ですが、親LaTeX文章ファイルmain.tex
を用意しています。
Unix系のコマンドラインからbuild2.sh
を実行します。つまり、
- 各Markdown原稿ファイルchXXXX.mdに対して、以下のPandocコマンドを実行します。
$ pandoc --from=markdown+ignore_line_breaks --to=latex --strip-comments \
--number-sections --top-level-division=chapter \
chXXXXX.md
- lualatexコマンドで、親LaTeX文章ファイルをタイプセットします。
$ lualatex main
この方法の嬉しいところは、前述のとおり、LaTeX事を親LaTeX文章ファイル下で完結していることです。これにより、Pandocは、Markdown(もどき)形式からLaTeX形式への変換器としての役割のみで完結します。また、Pandocへの独自フィルタや前処理、後処理を自由にできるので、自由度の高いLaTeX組版を行えます。
この方法の嬉しくないところは、LaTeX事のアレコレならびに、Pandocが行っているLaTeX事のアレコレの挙動(少なくともpandoc --standalone
とpandoc -D latex
、独自に拡張したLaTeX事など)を把握していないと、制御しきれないことです。
執筆や編集する方がLaTeXをあまり知らなくても、LaTeXによる自動組版で連続的な製作を進められる
冒頭で紹介させていただきました事例は、いずれも執筆、編集ともに、Markdown形式で1次原稿を進められました。原稿がリポジトリに上がったら、自動的にプレビュー用PDFをビルドしていたおかげで、通常の初校、再校、念校の区切りを大まかにもうけていたとしても、各区切りの段階で、内容の質を高められていたと思います。
また、編集者さんがTeXやPandocなどの環境構築が不慣れだったとしても、Dockerで共通の制作環境を利用することで、編集者さんのお手元でもPDFをビルドできるので、用語統一などの編集をすぐに原稿に取り込むことができていました2。
Markdown原稿からPandocしてテフライブ!しませんか?
以上、ものすごく簡単に、Markdown原稿からPandocしてLaTeX組版する事例を紹介いたしました。
本当は、ソースコードなどのリスト、各種ブロック要素、図表などがひと通りはいった例を取り上げたほうがよいかもしれませんが、LaTeX事の解説が多くなってしまうので、また何かの機会で、この話の続きができればと思います。
最後までお読みくださいまして、ありがとうございました。
Happy TeXing!