自治体のウェブサイトで HTTPS 対応が進んできている気配がしてきた。以前からWikidata でデータをメンテナンスしてきていて気が付いたので、思い切って普段よりも深めに作業してみた。いくつか気が付いたことがあったので、記録としてメモしておく。
- ドメイン名
- HTTPS が増えてきて、ホスト名が特定しやすくなってきた。以前は異なるホスト名で同一コンテンツが見えていたりしていた。
- 以前と同様に lg.jp への移行が進んでいる
- 県で独自に維持している
$perfecture.jp
等は市区町村のサイト($town.$prefecture.jp
の形式)のために残されていることも多い - 独自路線は減ってきたものの、相変わらず存在する。最上町 とか。
- 接続
- HEAD method では redirection が検出できないことがよくある。
- 中間証明書の設定でミスが出ている模様(サーバー側)。
- 証明書の有効期限が切れていることもある
- SSL プロトコルで SNI が使われていることもある
- 証明書に SAN (X509v3 Subject Alternative Name) が使われていることもある
- 弱い cipher が使われていることもある(そのせいで機械アクセスに失敗することもある)
- オープンデータ
Q309901
のサイト- P856「公式サイト」に P642「以下についての」で記述しているパターン(例)
- turtle 表記では
wd:Q170616 p:P856 [ pq:P642 wd:Q309901 ] .
のようになる。
- turtle 表記では
- P1325 「外部データURL」に P642「以下についての」で記述しているパターン(例)
- turtle 表記では
wd:Q194087 p:P1325 [ pq:P642 wd:Q309901 ] .
のようになる。
- turtle 表記では
- しかしデータ全体としてみたときには、使い方はどうなんだろうね。
- P856「公式サイト」に P642「以下についての」で記述しているパターン(例)
- 以前は海外からはアクセス禁止されているサイトも多かったが、今はどうなっただろうか。余力があれば調査したい。
- 証明書のチェーン情報を集めてみようと思ったけれども、python で取り出すのに苦労する
中間証明書設定
認証局が用意しているチェックサイトで確認できる。いくつかのウェブサーバは中間証明書の設定が正しくできていなかった。2019-04-01 現在見つけたものは 7 サイトある。HTTPS 対応が進むのは喜ばしい一方で、設定ミスを引き起こすポイントも新たに出現しているのですね。
Linux では ca-certificates
ではルート証明書のみが格納されているので、これで動いているプログラムからアクセスすると検証に必要な情報が足りず、失敗する。firefox
などのブラウザは中間証明書も全部抱えているので、問題なくアクセスできる(firefox では Software Security Device で持っている。参考)。現在存在する自治体のサイトは、以下の中間証明書 Intermediate Certificate を信頼すれば全てアクセスできるようになった。