LoginSignup
0
0

More than 3 years have passed since last update.

PDF-1.7 文字の基本的な扱い

Posted at

目次
ver.1.7仕様書 6th edition、3.1に相当します。

文字の基本的な扱い

PDFには大きく、regular、delimitter、white-spaceの三種の文字があります。それぞれ振る舞いが定義されますが、stringオブジェクト、streamおよびコメントの中ではこの限りではありません。

white-space

white-spaceはNameオブジェクトや数値などの区切りとして用いられます。
すべてのwhite-space文字は同等に扱われますが、stringオブジェクト、streamおよびコメントの中では例外です。その他のコンテキストの中では、あらゆるwhite-space文字が連続していても、単一のwhite-space文字として扱います。

decimal hexadecimal octal name
0 00 000 Null(NULL)
9 09 011 Tab(HT)
10 0A 012 Line feed(LF)
12 0C 014 Form feed(FF)
13 0D 015 Carriage return(CR)
32 20 040 Space(SP)

CR、LF、およびCRLFはend-of-line(EOL)(改行)マーカーとして扱われます。
EOLはほとんどの場合はwhite-spaceとして扱われますが行頭にあることが求められる(推奨される)ことがあります。(ここはよくわからない)

delimitter

delimitterは、string、array、nameオブジェクトおよびコメントを定義するための特殊文字です。
(,),<,>,[,]{,},/,%がdelimitter文字となります。

regular

white-spaceでも、delimitterでもない文字はregularとなります。ASCII文字で定義されない8bitバイナリ値もこれに含まれます。
regular文字の連続が1つのトークンを構成します。
※ PDFでは大文字と小文字を区別します。

コメント

%から行末までの文字はコメントとして扱い、単一のwhite-spaceがあるものとして虫します。なお、stringオブジェクト及びstreamに含まれる%は別です。

abc% comment {/%) blah blah blah
123

上の例では、「abc」と「123」がトークンとして認識されます。
コメントはPDFにおいて構文的な意味があるものではなく、PDFを編集するアプリケーションが出力する必要はありません。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0