しばらく放置していたらいろいろかわっていたので現行化.
- API対応がうんちゃらかんちゃら.
navi2ch公式にあるように2015/03/13の2ch側仕様変更にともない回避策が必要.基本旧形式(.dat形式)に対応させるプロクシでの対処.このへんに実装いろいろ.スクレイピングとAPIハック(というかクラック?)の二方式がある模様.推奨は公式にもあるとおり2chproxy.pl
.
で,これを設定したにもかかわらず,スレッド一覧が古いまま(PC等→UNIXとか辿っても現行スレが見えない)という現象が.bbstable
を更新したりしても全然駄目.http://peace.2ch.net/unix/
を w3m で叩くとなんか飛ばされてる?
- 某VPS使ってたらブラックリストに丸ごと載ってるっぽく…….
というわけで,w3m とかで http://peace.2ch.net/unix/
とか叩いて「もうずっと人大杉」の画面が出る人は規制喰らってる可能性大.多分2ch.net vs. 2ch.sc とかの殴り合いでクローラーを止めるためのフィルターに引っかかってるんだと思われる.バーボンハウスとかに個別規制情報は見あたらないんので.
- ってことは http を proxy 経由にするしかないのか
なんかこれで以前あきらめた記憶が甦ってきた.以前は prixovy とか squid とか上げるの面倒なので挫折したのだが,今回ちょっとググってtsocks による解法を発見.
要は,ssh -D
で簡易socks proxyをでっちあげ,そこにtsocks
経由で立ち上げた2chproxy.pl
を接続することで自宅のダイナミックIP経由で接続し,2ch側の規制を回避するという方法.ていうかこんな特殊環境のニーズってあるのか,とここまで書いて思いつつも,未来の自分のためにメモっておく.
vps # echo "server = 127.0.0.1\nserver_type = 5\nserver_port = 10080" > /etc/tsocks.conf
vps % ssh -D 10080 home_machine
vps % tsocks ./2chproxy.pl.v0.17.2