cat -v について
天体観測
見えないものを見ようとして
望遠鏡を覗き込んだ
BUMP OF CHICKEN 『天体観測』
いい歌ですよね。
望遠鏡の先の景色は、何が広がっていたんでしょうね。
大人になると、見たくないものも見えてしまうものです。
まあでも、たまには、見えないものを見ようとしたっていいじゃないですか。
見えるうちにね。
目次
1. cat -vとは
2. テスト例
3. おわりに
1. cat -vとは
cat
(concatenateの略)コマンドは、テキストファイルの内容を標準出力(通常は画面)に表示するためによく使用されます。
-v
オプションを付けることで、通常は見えない制御文字も特定の表現で表示します。
cat -v
コマンドは、特にデバッグやファイルの内容確認において非常に有用です。
非表示文字とは
非表示文字には、タブ文字、改行文字、そしてASCII制御文字が含まれます。
これらは通常、テキストエディタでは直接表示されませんが、cat -v を使用すると、これらの文字を視覚化して確認することができます。
cat -v の動作
ASCII制御文字(0x00 から 0x1F)は、^ に続けて特定の文字で表示されます(例:0x01 は ^A と表示)。
DEL文字(0x7F)は ^? と表示されます。
拡張ASCII文字(0x80 から 0xFF)は、M- に続けて特定の文字で表示されます。
詳しくは下記のサイトに
[参考]
IBM man
2. テスト例
このコマンドを使って、実際にどういう挙動になるのかテストしてみます。
まずは、ASCII文字全て(0x00 から 0x7F)と非ASCII文字(0x80 から 0xFF)を準備します。
本当はファイルをそのまま張りたかったのですが、やり方がわからず、ここでは紹介のみとさせていただきます。
本来は
echo -e '\x00\x01\x02\x03\x04\x05\x06\x07\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f\x20\x21\x22\x23\x24\x25\x26\x27\x28\x29\x2a\x2b\x2c\x2d\x2e\x2f\x30\x31\x32\x33\x34\x35\x36\x37\x38\x39\x3a\x3b\x3c\x3d\x3e\x3f\x40\x41\x42\x43\x44\x45\x46\x47\x48\x49\x4a\x4b\x4c\x4d\x4e\x4f\x50\x51\x52\x53\x54\x55\x56\x57\x58\x59\x5a\x5b\x5c\x5d\x5e\x5f\x60\x61\x62\x63\x64\x65\x66\x67\x68\x69\x6a\x6b\x6c\x6d\x6e\x6f\x70\x71\x72\x73\x74\x75\x76\x77\x78\x79\x7a\x7b\x7c\x7d\x7e\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff' > test.txt
のコマンドでうまくいくはずですが、私は無理でした。後日、そのファイルを含んだファイルを共有させて頂きます。
できたファイルの中身はこんな感じです。
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~≠ヤ・㊧炎旧克署葬灯楓利劒屆撼泛。「」、・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚珮粤蒟跚韜・・ⅰ涇・
文字化けしまくってますね(;^_^A
このファイルをcat -v
してみると
^@^A^B^C^D^E^F^G^H
^K^L^M^N^O^P^Q^R^S^T^U^V^W^X^Y^Z^]^_`abcdefghijklmnopqrstuvwxyz{|}PM-^QM-^RM-^SM-^TM-^UM-^VM-^WM-^XM-.M-/M-0M-1M-2M-3M-4M-5M-6M-7M-8-PM-QM-RM-SM-TM-UM-VM-WM-XM-YM-ZM
のように出力されます。
これで、ファイルの中に非アスキー文字の、なにがどこに配置されているかがわかるようになります。
3. おわりに
ファイルのバイト数をはかったところ
wc -c test.txt
> 256 test.txt (出力)
となりました。
あたりまえなのかもですが、256バイトなんだよなーとASCIIを実感した時間でした。