目次
ver.1.7仕様書 6th edition、3.1に相当します。
#文字の基本的な扱い
PDFには大きく、regular、delimitter、white-spaceの三種の文字があります。それぞれ振る舞いが定義されますが、stringオブジェクト、streamおよびコメントの中ではこの限りではありません。
##white-space
white-spaceはNameオブジェクトや数値などの区切りとして用いられます。
すべてのwhite-space文字は同等に扱われますが、stringオブジェクト、streamおよびコメントの中では例外です。その他のコンテキストの中では、あらゆるwhite-space文字が連続していても、単一のwhite-space文字として扱います。
decimal | hexadecimal | octal | name |
---|---|---|---|
0 | 00 | 000 | Null(NULL) |
9 | 09 | 011 | Tab(HT) |
10 | 0A | 012 | Line feed(LF) |
12 | 0C | 014 | Form feed(FF) |
13 | 0D | 015 | Carriage return(CR) |
32 | 20 | 040 | Space(SP) |
CR、LF、およびCRLFはend-of-line(EOL)(改行)マーカーとして扱われます。
EOLはほとんどの場合はwhite-spaceとして扱われますが行頭にあることが求められる(推奨される)ことがあります。(ここはよくわからない)
##delimitter
delimitterは、string、array、nameオブジェクトおよびコメントを定義するための特殊文字です。
(,),<,>,[,]{,},/,%がdelimitter文字となります。
##regular
white-spaceでも、delimitterでもない文字はregularとなります。ASCII文字で定義されない8bitバイナリ値もこれに含まれます。
regular文字の連続が1つのトークンを構成します。
※ PDFでは大文字と小文字を区別します。
#コメント
%から行末までの文字はコメントとして扱い、単一のwhite-spaceがあるものとして虫します。なお、stringオブジェクト及びstreamに含まれる%は別です。
abc% comment {/%) blah blah blah
123
上の例では、「abc」と「123」がトークンとして認識されます。
コメントはPDFにおいて構文的な意味があるものではなく、PDFを編集するアプリケーションが出力する必要はありません。