はじめに
FOSS4G Advent Calendar 2016でpix2pixで色々やってみた話を投稿しましたが、その奥深さに惹かれていろいろ試したくなりましたので、その中間報告的な感じのお話を今回はしてみようかと思います。
地理院タイル to OpenStreetMapリベンジ
前回のお話で地理院タイルからOpenStreetMapをやってみましたが、精度がいまいちでした。
この原因として考えられるのがデータセットの偏りです。
前回は東京で学習させて京都を未知画像としました。
東京は極めて密集しており、道路もマス目状ではなく、複雑な形状をしております。東京はある意味日本の中では特殊な形状ではないかと思い、東京だけではなく、別な都市を教師データとして追加してみることにしました。今回は京都を対象としたいので、同じようにマス目である札幌市を加えてみることにしました。
また、OpenStreetMapは建物地物が場所により密だったり疎だったりと一定ではないので、建物地物が密な場所を学習データに使ったほうが衛星写真と矛盾しないのではないかという仮説を立てました。
東京と札幌は他の地域と比べると建物地物の密度がかなり高いように思えます。やはりマッパー人口でしょうか。我が地元の盛岡市はスカスカでした・・・。こういうマッパー人口が少ないことによる地域格差を何とかするには自動生成によるプロポーサルを人間が判定するような仕組みは良いような気がします。
京都市も建物地物はあまりなかったので、建物地物が無いところに密な建物地物が現れるのでしょうか?
さてさて結果はどうなったでしょう?
出典:地理院タイル
おお!?
前よりいい感じに建物が描画されているような気がします。
道路も比較的はっきり描画されている気がします。
ためらい線のような迷ってる感じが減ってますね。
個人的には良さげに見えますので、リベンジ完了!
おまけ
東京 to 東京で試しにやってみました。ちなみに対象は未知データです。
精度がすごい高いような気がします。
やはり特徴(あるいは衛星写真の露出などの条件?)が似通っていると精度が高くなるのでしょうか。
標高タイル to 色別標高図
OpenStreetMapの出来に感動したので、では次はということで標高タイルから色別標高図はいけるのかが気になりました。
標高タイルから色別標高図は簡単にできるので意義的にはあまりないのですが、色別標高図にある川とか湖とかその辺をどうやって表現できるのかが気になりました。
まずは単純に標高タイルから色別標高図をやってみます。ちなみに標高タイルはそのままでは標高数値データのみですのでこれをpix2pixで扱うためにPNG画像に変換しました。標高PNGタイルに関しては産業技術総合研究所さんのこちらを参照しております。ありがとうございます!
出典:地理院タイル
色や陰影はほぼいい感じに再現されていますが、川がなんか同じ場所に連続で出ていますので迷っている感じが有ります。これは標高タイルに川の特徴が取れないからではないかと推測されます。川底までの標高があるような1mメッシュDEMであれば川も行けるかもしれませんが、とりあえずアルファチャンネルに川画像タイルを追加してみました。
川画像タイルに関しては皆さんご存知TAKEMURA Kazuhiro氏(@vec2ras)作川だけ地図を使わせて頂きました!ありがとうございます!
出典:地理院タイル
おお!いい感じに川が描画されました。ただ元々湖のデータがなかったのでこちらは再現されていないようです。これは別途湖データを加えれば良いかもしれません。
ここで分かったのはnチャンネルからnチャンネルに変換できることです。モノクロ(1ch) to カラー(3ch)が出来るので行けるかなーとは思ったのですがチェンネル数が増えても問題ないようです。
標高タイル to 陰影図
川の判定がまだイマイチだったので、今度は完全に標高データのみから作成できる陰影図はどうだろうかと試してみました。
影の向きが怪しいですがほぼほぼいい感じです。やはり特徴が完全に取れるものは再現率高いような感じです。
netcdf to 等高線
先程の標高タイル to 色別標高図でチャンネル追加して4chから3chに変換できましたので、これは多次元グリッドデータも変換できるのかということでNetCDF化した数値予報GPVから気圧の等高線が書けるのかが!私、気になります!
NetCDFはそのままではpix2pixで読めませんので画像からではなくnetcdfから直接数値データをインプットデータに突っ込むようにパッチを当てました。
それでは早速試してみます。
※インプットがnetcdfのためインプット画像はありません。
うーん。
なんかだめですね。学習用データ数が少ないのかと思い増やしてみましたが結果は変わりませんでした。考えられるのは等高線のようなスパースなデータは苦手かもしれません。そこでカラーグラデーションにしてやってみることにします。
おお!
これはいい感じです!やはり畳み込む性質上密なデータが良いかもしれません。
標高タイル to CS立体図
nチャンネル to nチャンネルがいい感じに行けることがわかったので、次はfoss4g
advent calendarでfrogcatさんが書かれていた地理院標高タイルと Leaflet でつくるCS立体図を見て初めて知ったCS立体図を、標高タイルから作れるか試してみます。
CS立体図とは標高データから算出される曲率と傾斜による立体図法のことで長野県林業総合センターで作られたオープンな立体図法のようです。この辺の立体図関係は特許が合ったりするのでオープンな規格は大変助かります。
frogcatさんが書かれていたのはjavascriptでしたので、それをnode.js使ってそのまま使うか迷ったのですが、今後の汎用性を考えてpythonに移植しました。pythonはforが遅いですが、想像以上に遅いです。numpyとかcythonとかpypyとか使えるならそっち使ったほうが良いですね。ソースはリファンダリングにしたらgithubに置いておきます。 [ソース置きました]
(https://github.com/makinux/PyCsmap)
標高タイル to 陰影図のような元データから計算できる系は精度が高いのではないかという予想は有りました。
さて結果の方は・・・?
解像度がちょっと低い感じですが、まるっと学習できているように見えます。
すごいですねぇ・・・pix2pix。アルゴリズムによって算出できるものはほぼまるっと学習出来るのではないでしょうか。
CS立体図 to 地すべり地形分布図
実はCS立体図できた段階で満足してたんですが、某氏より以下のようなネタ振りがあったので全力で釣られてみました。
この辺は専門外なのでよくわかっていなかったのですが、そもそも崩壊地形って何処かで情報出しているのだろうか探ってみました。
調べてみるとJ-SHIS(地震ハザードステーション)で地すべり地形分布図という名前でWMSサービスが有りましたので、こちらを使わせて頂きました。
WMSでしたので、tmsに変換したりと一手間加えました。あと、何故かWMSの場合にリクエストがまれに失敗する場合があるのでリトライ処理など加えたほうが良いかもしれません。
さてさて結果の方は如何でしょうか?
うーん?
平野部ではほとんど無く、山間部などに集中していることからある程度は地すべりの特徴を学習しているようです。
ただ、正解と比べるとまだまだ違いが目立ちます。
CS立体図だけではなく、地質など別な要因も見ないと地すべりの判定はできないかもしれませんが、とりあえず今回はCS立体図のみでどこまで学習できるのか試してみます。CS立体図のみで地すべりが判定できると仮定した場合、うまく判別できない理由は、微細地形ではないからか?という仮設を立てました。
今回はざっくり様子を見るつもりだったので地理院標高タイルの10mメッシュでやってみたのですが、よくよく考えると地すべりってもっと細かい単位でないと学習できない?人の目で見て判定するのもそう言えば元々のCS立体図を考案した長野県林業総合センターも1mメッシュ使って判定していたし、CS立体図のメッシュ解像度が足りてない可能性が高いです。
それでは1mメッシュのDEMが何処かに無いか探したのですが、国土地理院で公開されているのは基盤地図数値情報の5mメッシュまでです。有料だといろいろあるのですが、検証のためには使いたくありませんので、色々探してみました。
USGC(アメリカ地質調査所)で1/9 arc seconds=3mのDEMは有りましたが、対応する地すべりマップはなさそうでした。
NOAA(アメリカ海洋大気庁)で1m以下の海底地形データは有りましたが、これもやはり対応する地すべりマップはなさそうでした。というか海底地形は関係ないですね、今回は。
日本で良い感じのデータがないかなーと探していたところ、そう言えばCS立体図を作った長野県林業総合センターで公開してないんだろうかと見に行ったら、WORDで申請書を書かなければいけないのと、そもそも林業関係者でないとだめっぽいので諦めました。
他にはないかなーと探していると、frogcatさんの記事に静岡県CS立体図という記述を発見しました。どれどれと見てみると、なんと1mメッシュで作成したCS立体図のgeotiffがコモンライセンスで公開されておりました!
これは使うしかないとい言うことで早速試してみました。
・・・
全く学習できてないですね・・・。
もしかして参照系がズレているんでしょうか。
見た目的に崩落と関係なさそうなところにシェープが有ります。
というわけで今のところCS立体図(1mメッシュ)では精度が上がりませんでした。むしろ10mメッシュのほうがなんかそれっぽい感じで学習できていました。
残念!
この辺はもう少し時間をかけて良い結果が出たらお知らせします!
#追記
CS立体図だけではうまく行かんかったので、CS立体図+地すべりの6chで学習させたところいい感じになりました。もういくつ寝るとお正月~♪ということで大規模データセットで正月ガッツリ寝かして結果を待ってみます。
#おまけ
札幌+東京 to 札幌でやってみた結果も載せておきます。
かなりよいですねぇ。札幌は建物と道路の境界がはっきりしているので認識しやすいのかもしれません。