picoCTF Writeup: WhitePages
WhitePages問題を知ろう問題
- ジャンル: Forensics
- 難易度: Medium
Writeup
問題文
I stopped using YellowPages and moved onto WhitePages... but the page they gave me is all blank!
黄色いページをやめて白いページにした。。。でも、真っ白になった!
まずはcurlでファイルをダウンロードします。
curl -O https://challenge-files.picoctf.net/c_fickle_tempest/f35d2be8de731d412d3dbd8c79e6c5b32c62efbb124cf319f54ebddf76ea0ffe/whitepages.txt
fileでファイルをみます。
$ file whitepages.txt
whitepages.txt: Unicode text, UTF-8 text, with very long lines (1296), with no line terminators
UTF-8のテキストファイルですね。
メタデータをexiftoolで確認します。
$ exiftool whitepages.txt
ExifTool Version Number : 13.25
File Name : whitepages.txt
Directory : .
File Size : 2.8 kB
File Modification Date/Time : 2025:12:13 07:59:24+09:00
File Access Date/Time : 2025:12:13 11:55:12+09:00
File Inode Change Date/Time : 2025:12:13 07:59:24+09:00
File Permissions : -rw-rw-r--
File Type : TXT
File Type Extension : txt
MIME Type : text/plain
MIME Encoding : utf-8
Byte Order Mark : No
Newlines : (none)
Line Count : 1
Word Count : 343
とくに怪しい点はありませんね。
hexdumpで中身をみてみます。
└─$ hexdump -C whitepages.txt | head
00000000 e2 80 83 e2 80 83 e2 80 83 e2 80 83 20 e2 80 83 |............ ...|
00000010 20 e2 80 83 e2 80 83 20 20 20 e2 80 83 e2 80 83 | ...... ......|
00000020 e2 80 83 e2 80 83 e2 80 83 20 20 e2 80 83 20 e2 |......... ... .|
00000030 80 83 e2 80 83 20 e2 80 83 20 20 e2 80 83 e2 80 |..... ... .....|
00000040 83 e2 80 83 20 20 e2 80 83 20 20 e2 80 83 20 20 |.... ... ... |
00000050 20 20 e2 80 83 20 e2 80 83 e2 80 83 e2 80 83 e2 | ... ..........|
00000060 80 83 20 20 e2 80 83 20 e2 80 83 20 e2 80 83 20 |.. ... ... ... |
00000070 e2 80 83 e2 80 83 e2 80 83 20 e2 80 83 e2 80 83 |......... ......|
00000080 e2 80 83 20 20 e2 80 83 e2 80 83 e2 80 83 e2 80 |... ...........|
00000090 83 e2 80 83 20 e2 80 83 20 e2 80 83 e2 80 83 e2 |.... ... .......|
e2 80 83と20だけでできているファイルのようです。
少し調べたところ、e2 80 83と20はどちらも「空白文字」を表していることが分かりました。
20は Unicode U+0020の通常のスペースで、
e2 80 83は Unicode U+2003 の EM SPACEというスペースを 表現したバイト列です。
見た目はどちらも空白ですが、バイト列が異なるところがポイントです。
このそれぞれの空白を0/1のバイナリにしてみると、flagが浮き出てくるかもしれません。
まずは、
xxd -pでプレーン16進数を出して、
trで改行を削除して、
sedでそれぞれを0/1に置換します。
$ xxd -p whitepages.txt | tr -d '\n' | sed 's/e28083/0/g; s/20/1/g'

このバイナリを、CyberChefに突っ込んでみます。
無事にフラグ取れました。(フラグはマスクしています。)
まとめ
今回の問題は、Unicodeでのスペースでできたバイト列を別ルールでバイナリ化しASCII変換して、flagをとるという問題でした。
文字コードの考え方っていつも混乱しますが、こういう問題を何度もやれば整理・定着してきそうな気がしました。
大変興味深い世界で、今日もよく眠れる。
