Help us understand the problem. What is going on with this article?

TeX処理系御伽話

More than 5 years have passed since last update.

この記事はTeX & LaTeX Advent Calendar 2013の15日目の記事です。

処理系とは

TeXの処理系とはTeXファイルをぶち込むとDVIなりPDFなりが出てくるプログラムのことです。実際に使ったことがなくても、だいたい次のようなものを聞いたことがあるのではないかと思います。

  • pTeX
  • XeTeX
  • pdfTeX
  • LuaTeX

さて、ここで疑問なのがこれらは一体何が違うのかということですね。何を使うかで迷っている人は、とりあえずこれらの違いだけでも説明出来たらいいなと。

pTeXとその仲間たち + e-TeX

e-TeXが入っているのは、こっちの方が説明が分かりやすいと思ったからです。

pTeX

pTeX はTeXに日本語向けの様々な機能を追加した処理系です。代表的なものを挙げると、次のようなものが追加されています。

  • 縦書き組版
  • 日本語禁則処理
  • 日本語と欧文が混在した時の処理

つまり処理系を改造して日本語を扱うための機能を実装したということですね。理系の文書ではよくある日本語と欧文の混在もpTeXからサポートされていることになります。

ptex.png

e-TeX

ところがこの時、pTeXとは別の考えでTeXを改造しようと考えた人達がいました。例えば次のような拡張です。

  • レジスタ(変数的なサムシング)の上限を増加
  • 新たな条件式を追加

このような拡張を積んだ新たな処理系として e-TeX が開発されました。こうして、TeXからフォークした処理系が二つ誕生するわけです。

etex.png

TeXで文書を書く人も、レジスタを自分で定義したり何か条件式を使って組版を制御したりする人はあまりいないかもしれませんが、このような機能は複雑な組版を行う上では時々役に立ちます。

e-pTeX

この二つの処理系(pTeXとe-TeX)をマージしようという人間が現われました。こうして二つの処理系を合体させた e-pTeX が誕生します。

eptex.png

ということで、現在日本語組版ではこのe-pTeXが用いられていることが多いと思います。
例えばターミナルでplatexというコマンドを打つと、

This is e-pTeX, Version 3.1415926-p3.4-110825-2.6 (utf8.euc) (TeX Live 2013)
 restricted \write18 enabled.

などと表示されると思います。e-pTeXを使っているということですね。

upTeX, e-upTeX

さて、これで一件落着かと思いきや、そう事は簡単ではありません。pTeXの拡張で日本語が扱えるようになったといっても、それはJIS第一・第二水準までを扱えるようになったということで、近年は常識となりつつあるUnicodeには対応していませんでした。
このままだと例えば「髙(はしごたか)」など特殊な文字や、あるいは中国語・韓国語などがうまくいかないわけです。さらに、TeXの文書ファイルをUTF-8などで書いていると不味いことになってしまうなど不自由が募ります。

そこでまず、nkfなどを用いて入力されるTeXファイルをEUCか何かに変換して、その物体を従来のpTeXなどに捩じ込むという解決策が提案されました。
最近platexコマンドを使う時にはオプションとして--kanji=utf8を使うと思いますが、これは内側でこういう変換が行なわれています。
これでひとまずユーザーがいちいちnkfを使う必要はなくなりましたが、どのみち「髙」などが上手くいかない状況に変化はありません。
例えば次のようなものをe-pTeXで処理すると「髙」が亜空間へと消滅します。

\documentclass{jsarticle}

\begin{document}
「髙(はしごたか)」
\end{document}

スクリーンショット 2013-12-14 17.34.12.png

そこで otf パッケージというものが提案され、文字コードのようなものを直接入力することでなんとかしようということになりました。こんな感じです。

\documentclass{jsarticle}
\usepackage{otf}

\begin{document}\UTF{9AD9}(はしごたか)」
\end{document}

スクリーンショット 2013-12-14 17.34.56.png

ただ、これはこれで正直微妙です。なのでpTeXを改造して、内部文字コードをUnicodeにしようという試みが行われました。これが upTeX です。
そうしたら後はe-TeXとのマージですね。e-TeXとマージされたものが e-upTeX となります。

euptex.png

これらを用いると、そのまま「髙」を出力出来ます。

\documentclass[uplatex]{jsarticle}

\begin{document}
「髙(はしごたか)」
\end{document}

スクリーンショット 2013-12-14 17.35.20.png

XeTeX

XeTeX もe-TeXの処理系を改造したものの一つです。

xetex.png

XeTeXの特筆すべき機能は次のようなものです。

  • Unicodeを扱える
  • フォントに関する拡張

Unicodeに関する苦労は先ほどupTeXの部分で取り上げたので省略します。

XeTeXは今まで紹介した処理系とはフォントに対する処理が異なります。というのも、今までに紹介した処理系はどれも「DVIファイルを出力して、フォントに関してはDVIを処理するアプリにおまかせ」という方針でした。何故ならフォントの扱いはデバイスに依存する情報ですので、フォントを扱うというのはDVIの理念である"device independent"に反します。
ですので、e-pTeXなどではフォント埋め込みPDFを作る際は、

  1. TeX側の設定( otf パッケージとかでやる)
  2. dvipdfmxなどの設定(kanji-config-updmapとか)

という二つの手間が必要で、どうやればいいのか混乱することがままあります。
ですがXeTeXはこのデバイス非依存のDVIを生成することをそもそも諦め、デバイスに依存する代わりにデバイスで使えるフォントをそのまま使うことで面倒な設定を抜きにフォントを使用出来るようになっています。
ちなみに、XeTeXは直接PDFが生成されているように見えますが、実際は中でXDVなるDVIを拡張した形式を一旦経由して、その後 xdvipdfmx というdvipdfmxを改造した物体を用いてPDFを生成しています。

XeTeXを用いた組版はXeLaTeX で日本語する件についてなどで述べられていまして、日本語組版に対応しているようです。ただpTeX系と違って処理系を日本語へ特化させたというわけではないです。

pdfTeX

これも(e-)TeXを改造した処理系で、欧文圏では高い人気があるようです。

pdftex.png

名前の通り、これはDVIファイルを経由せずに直接PDFを吐きます。これには次のような利点があります。

  • PDFを操作するための命令がTeXファイルから使える

e-pTeXなどの処理系はあくまでDVIを作ってDVIからPDFへはdvipdfmxなどに任せるというスタンスでしたが、pdfTeXはもはやDVIを作らないので、PDFに影響を与えるプリミティブな命令が用意されています。これらは例えばリンクの出力や、複雑な図の作成で効果を発揮します。

LuaTeX

さて、 LuaTeX とはpdfTeXの派生で、名前にある通りLuaのコードをTeXファイルに入れることが出来ます。pdfTeXと、内部エンコーディングをUnicodeにした Omega という処理系の血統です。

luatex.png

こちらもpTeX系とは違って処理系を直接改造して日本語化対応しているわけではありませんが、LuaTeX-jaなど、日本語組版をがんばろうという活動が盛んに行われています。またpdfTeXの後継ということがもう決定していることもあって、将来への安心感もあります。

まとめ

さて、色々な処理系の開発経緯が明らかになったわけですが、ここで私の独断と偏見で感想を書きます。

pTeX系

まず、pTeX系の中ではUnicode対応などで e-upTeX がオススメ感があります。 jsclasses など日本語組版に必要なパッケージも e-upTeX に対応しているので、e-upTeXがいいのではないでしょうか。
ただ私としては特に不都合がなければ、無理にe-pTeXからe-upTeXにしなくともよいと思います。

その他

XeTeXLuaTeX の二択だと思います。pdfTeXで日本語組版をしている話は全然聞かないです。

私はXeTeXを使っていた時がありますが、日本語組版を行う場合はzr_tex8rさんが作成したZXjatypeを使うことになると思います。このZXjatypeに使われているxeCJKというパッケージがありますが、これがどうも中国語に特化しているようで、あまり日本語と仲良く出来ていない感じがあります。
ただ、XeTeXのフォントをカジュアルに使えるという点はとても素晴らしいです。なので私は変なフォントを使いたい所だけXeTeXで作って、出来あがったPDFをe-pTeXなどで読み込んだり、あるいは逆にe-pTeXなどで作ったPDFをXeTeXで読み込み加工するという方法を取っています。

ならLuaTeXなのかという話ですが、私自身はLuaTeXを全然使ったことがないので何とも言い難いです。ただ、本当にLuaが書けます。「Real World LuaTeX —Luaで書ける喜び—」ですね。
時々使う機会としては、TikZで図を作る時でしょうか。多分pTeX系でも問題ないと思うのですが、pdfTeX系とTikZは仲が良いらしいので、TikZで作った図をpdfTeXやLuaTeXを使ってコンパイルして、出来あがったPDFをpTeX系の処理系で読み込むといった感じの使い方をしています。
今回の記事にある各処理系の派生グラフみたいな図もTikZで作ってpdfTeXでコンパイルして、出来たPDFをconvertコマンドでPNGに変換しています。

yyu
暗号やプログラム言語の記事をよく書きます。 I'm interested in Programming and Cryptography.
https://twitter.com/_yyu_
recruitmp
結婚・カーライフ・進学の情報サイトや『スタディサプリ』などの学びを支援するサービスなど、ライフイベント領域に関わるサービスを提供するリクルートグループの中核企業
http://www.recruit-mp.co.jp/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした