More than 3 years have passed since last update.

巡回セールスマン問題(TSP)の面白いと思った応用３例(色・単語・音楽)

Posted at 2022-08-06

巡回セールスマン問題

巡回セールスマン問題(以下TSP)についてご存知でしょうか。

完全グラフと全ての辺の移動コストが与えられた上で、全ての点を１回ずつ通り、始点に戻る巡回路の中で総移動コストが最小となる巡回路を求める組合せ最適化の問題です。

今回の記事の趣旨とは異なるため、ソルバーの詳細及びTSPを解くアルゴリズムの紹介は他の文献に譲ります。(個人的には辺の移動コストが定数でないTSP (dynamic TSP)にも興味があるので追ってまとめたいと思います。実応用としては、渋滞が発生して移動時間が変わる等の状況を考慮することに相当します。)

TSPの応用としてはその名についているように人が全ての与えられた場所の集合を回る、郵便物などの配送*やテーマパークで回る順番を考える問題が多いかと思いますが、それらの実空間で何かの対象物が移動する以外の面白いなと思った応用例について３つ紹介して行きたいと思います。

(* 実際の配送計画問題は時間指定やトラックの許容量など追加の制約が多く入るため、純粋にTSPとして定式化できるケースはまずないと思います。)

色集合から"自然な"カラーパレットの作成

Dynamic Closest Color Warping to Sort and Compare Palettes (SIGGRAPH'21)

論文リンク

著者スライド (本セクションの図はこちらから引用)

著者実装

カラーパレットの中では複数の色が感覚的に自然な色の並びをしているかと思います。(少なくとも、赤・青・オレンジのような不自然な色の並びはないかと思います。)

例えばこういうものですね。

色達が与えられた元で自然な色の並びをしたカラーパレットを作成するという問題などをTSPに定式化して解いています。

色同士の類似度を測る方法としては、単にRGB値の差分の(二乗)和をとる、HSV表記をして差分を取る等考えられますが、本研究では色をCIELAB空間上の点として表した上でCIE DE2000を用いて類似度を定義しています。

参考: 色の距離（色差）の計算方法

Single Palette Sorting

まず、色集合が与えられた上でそれらを自然に並べたカラーパレットを作成したい問題を考えます。

上記の方法で色同士のコストを定義した上でTSPのsolverとしてはLKHを用いて解いています。

TSPの解は巡回路であるため、一列に並んでいるカラーパレットにするためにはどこかの枝を切る必要があります。その枝は、TSP解のパスに含まれる枝のコストの中で最大の枝を選んでいます。

個人的には後から枝を切るよりは、super source兼super sinkの仮想点を１つ作ってTSPを解いた方が良い解が求まると思います。(論文中で解いている問題は、カラーパレットの両端の色同士が"ある程度"似ていることを要請しているため。)

定量評価において、以下の３つの指標が利用されています。

ここでは説明の便宜上、提案手法で出力されたカラーパレットを予測パレット、正解データのカラーパレットを正解パレットと呼ぶことにします。

Success Rate
- 正解パレットと予測パレットが完全に同じ割合
Levenstein Distance
- 正解パレットと予測パレットのLevenstein Distance (例えば、２つの文字列の類似度を計算する際に用いられる)
Length of Longest Increasing Subsequence
- 予測パレットから順番を変えずに抜き出して作れる正解パレットの部分列の最長の長さ

Palette Pair Sorting

次に、複数のカラーパレットを同時に並び替える問題について考えます。

この問題では、Single Palette Sortingで考えていた「色同士が”自然に”並んでいる」ことに加えて、「ソート後の２つのカラーパレットの各インデックスの色がある程度似ている」ことを実現しようとしています。

(一旦、与えられた色が２つのカラーパレットの色であることを忘れて、)Single Palette Sortingと同様に与えられた２つのカラパーレットに含まれる全ての色同士の類似度を計算し、LKH solverを用いてTSPを解きます。

「ソート後の２つのカラーパレットの各インデックスの色がある程度似ている」ためにどの枝を切るのかを考える必要があります。

手順

TSPを解いた結果同一カラーパレット内の最長の２つの色のペア(点のペア)を考える。(TSPを解いた結果、それぞれのカラーパレット同士が一般に交互に並んでいるとは限らないことにも注意)
２つの点を結ぶTSPの解のパスのうち、点数が少ない方を抽出 (TSPの解は巡回路なので２パターンパスが存在する)
そのパスの中で最も枝のコストが大きい枝を選択する

それぞれのカラーパレットに対してSingle Palette Sortingを解いた結果との比較が載せられています。(下図参照: PPS : Pair Palette Sorting, SPS : Single Palette Sorting)

例では、２つのカラーパレットかつ長さが同じパレットの並び替えの結果が載せられていますが、この手法自体は３つ以上のカラーパレットを同時に並び替える場合やカラーパレット同士の長さが異なる場合にも適応可能です。

Similarity Measurement

他にも、与えられた２つのカラーパレットの類似度をどのように求めるのか？という問題についても手法が提案されています。

既存手法は、２つのカラーパレットの要素毎(element-wised)に何かしらの類似度を計算しているとのことですが、カラーパレットの全体(flow-based)の類似度を測る指標を提案しています。

その手法を Dynamic Closest Color Warping (DCCW) と名付けています。

２つの時系列データの類似度を測る方法としてDynamic Time Warping (DTW) をご存知の方は、それを思い浮かべながら読んで頂けると理解が早いかと思います。

DTWでは与えられた２つの系列データの中の適当な２つの要素同士の距離の和を用いて計算されますが、DCCWでは、ある系列データの１つの要素から、もう１つの系列データの隣り合う２つのデータのペアに下ろした垂線の長さを用いてDCCWで用いる $W(A,B)$ が定義されています。(この辺りがflow-basedと主張している所以かと、下図参照)