More than 1 year has passed since last update.

【SCC編】AtCoder Library 解読〜Pythonでの実装まで〜

Last updated at 2023-12-27Posted at 2022-05-08

0. はじめに

2020年9月7日にAtCoder公式のアルゴリズム集 AtCoder Library (ACL)が公開されました。
私はACLに収録されているアルゴリズムのほとんどが初見だったのでいい機会だと思い、アルゴリズムの勉強からPythonでの実装までを行いました。

この記事ではsccをみていきます。

ACLでは scc と internal_ecc が存在し、internal_scc が本体、scc がインターフェイスのようになっています。これは、scc のアルゴリズムを他(twosat)でも使うためです。なので、ACLの実装を見たい場合はinternal_scc.hppを見てください。

対象としている読者

sccってなに？という方。
sccを理解し自分で実装できるようにしたい方。
ACLのコードを見てみたけど何をしているのかわからない方。
C++はわからないのでPythonで読み進めたい方。

参考にしたもの

DFS tree について

Tree, Back, Edge and Cross Edges in DFS of Graph

lowlink について

Tarjan's SCC : example showing necessity of lowlink definition and calculation rule?

1. 前提知識

本記事を読む上での前提知識を確認しておきます。詳しい説明は各自調べてください。

有向グラフ

辺が向きを持つグラフです。

DAG

DAG は有向グラフのうち、サイクルを持たないグラフです。
有向非巡回グラフ（Directed Acyclic Graph: DAG）。

DFS, DFS tree

DFS はグラフを探索するためのアルゴリズムの１つです。深さ優先探索(Depth First Search: DFS)。
DFS を行ったときに通った辺のみを残すと木（森）になり、これを DFS tree と呼びます。

トポロジカルソート

DAG の頂点を１列に並べたとき、全ての辺が同一方向になるように頂点を並べることです。
グラフが DAG ならば必ずトポロジカルソート可能です。

CSR

疎行列のデータを保持する方法の１つです。ACL ではグラフの辺集合を保持するために使っています。
【internal_csr編】AtCoder Library 解読〜Pythonでの実装まで〜で説明しています。

2. SCC とは

まず、SCCとは何かを見ておきます。

2.1. SCC

SCC は Strongly Connected Component の略で日本語では強連結成分と呼ばれます。
有向グラフにおいて、次の条件を満たす部分グラフを強連結であると呼びます。

任意の頂点 $v, u$ について $v$ から $u$ へのパスが存在する。

つまり、どの２頂点も互いに行き来できるグラフです。
そして、強連結かつ極大な部分グラフを強連結成分と呼びます。
具体例として下図のようなグラフを考えます。

頂点集合 ${0, 1, 2}$ は、
$0$ から各頂点へのパス

$0$
$0 \rightarrow 1$
$0 \rightarrow 1 \rightarrow 2$

$1$ から各頂点へのパス

$1$
$1 \rightarrow 2$
$1 \rightarrow 2 \rightarrow 0$

$2$ から各頂点へのパス

$2$
$2 \rightarrow 0$
$2 \rightarrow 0 \rightarrow 1$

が存在するので強連結であり、かつ極大なので強連結成分です。

また、頂点集合 ${4}$ は、
$4$ から各頂点へのパス

が存在するので強連結であり、かつ極大なので強連結成分です。

一方、頂点集合 ${3, 5}$ は、
頂点 $5$ から頂点 $3$ へのパスが存在しないので強連結ではありません。

このグラフの強連結成分は下図のようになります。

このように、有向グラフを強連結成分に分解することを強連結成分分解と言います。

また、各強連結成分を１つの頂点とみなしてできるグラフを本記事では縮約されたグラフと呼ぶことにします。
縮約されたグラフは DAG になります。

2.2. ACLのSCC

ACL の SCC は与えられた有向グラフを強連結成分分解し、さらに頂点を、縮約されたグラフでトポロジカルソートした結果を返します。
今回の例では

[[2, 0, 1], [4], [3], [6, 5, 7, 8], [9, 10]]

のような結果になります。(トポロジカルソートが一意でない場合にはそのうちのどれかになりますし、各強連結成分内での頂点の順序は未定義です。)

3. 強連結成分を求めるアルゴリズムたち

強連結成分を求めるアルゴリズムには有名なものが2つあります。

Kosarajuのアルゴリズム

まず、１回DFSを行い、その後、辺を逆向きにしたグラフでもう１回DFSを行うことで強連結成分を求めます。
詳しくは強連結成分分解の意味とアルゴリズム | 高校数学の美しい物語などを見てください。

Tarjanのアルゴリズム

ACLの実装であり、本記事で見ていくアルゴリズムです。１回のDFSで強連結成分を求めることができます。

4. Tarjanのアルゴリズム

では具体的な方法を見ていきます。
ここからは具体例として以下のグラフを考えることにします。

Tarjanのアルゴリズムの目的は、各頂点にその頂点が所属する強連結成分固有の値(SCC idと呼ぶことにします)を割り振ることです。
また、SCC id の昇順に強連結成分をたどると、縮約されたグラフでトポロジカルソートされた順序になっているようにします。

今回の例では下図のように SCC id を付与することを目標とします。

4.1. DFS tree

まずはこのグラフを DFS して、DFS tree を構築します。
DFS の仕方によってDFS tree は変わりますが、ここでは頂点 $0$ から始めて隣接頂点のうち未訪問の頂点を優先し頂点番号が小さい頂点から順に訪問することにした結果、下図のようになりました。また、DFS tree に含まれない辺(DFSで使用しなかった辺)は破線で表しています。

4.2. 辺の分類

今後の説明のため、全ての辺を特徴に合わせて以下の４つに分類し、名前をつけて呼ぶことにします。

1. tree edge
DFS に使われた辺を tree edge と呼びます。例えば、頂点 $1$ から頂点 $4$ への辺がこれに当たります。

2. forward edge
tree edge でない辺のうち、頂点 $v$ から頂点 $u$ への辺であって、$u$ が $v$ の子孫であるものを forward edge と呼びます。例えば頂点 $2$ から頂点 $8$ への辺がこれに当たります。

3. back edge
tree edge でない辺のうち、頂点 $v$ から頂点 $u$ への辺であって、$u$ が $v$ の祖先であるものを back edge と呼びます。例えば頂点 $3$ から頂点 $1$ への辺がこれに当たります。

4. cross edge
tree edge でない辺のうち、頂点 $v$ から頂点 $u$ への辺であって、$u$ と $v$ が祖先・子孫の関係でないものを cross edge と呼びます。例えば頂点 $7$ から頂点 $3$ への辺がこれに当たります。

4.3. 頂点の特徴づけ①

頂点番号はただのラベルであり、グラフの構造には関係ないので、強連結成分を求めるのには役に立ちません。そこで、構築した DFS tree に固有の特徴づけを行います。
具体的には、DFS で初めて訪問した順(いわゆる行きがけ順)に頂点に値を付与します。この値を order と呼ぶことにします。

このような特徴づけを行うと次の性質が見えてきます:

頂点 $u$ から頂点 $v$ への cross edge であって、order[$u$] < order[$v$] となるものは存在しない。

なぜなら、もしそのような辺が存在するならばその辺は DFS で使われる (tree edge である)はずだからです。

4.4. SCCの観察

さて、先ほど定義した order と強連結成分分解の結果を重ねてみると下図のようになります。

これを観察すると次のことが見えてきます:

各強連結成分はその成分内で order の最も小さい頂点を根とした木構造になっている

これが正しいかどうかを確認します。

DFS tree が１つの強連結成分から構成される
頂点数が 2 以下
全ての強連結成分は１つの頂点で構成される

のいずれかを満たす場合は明らかなので、そうでない場合を考えます。
頂点 $A, B, C$ を用意します。
ここで、これらは以下の条件を満たすようにします。

$A$ と $B$ は同一の強連結成分に属する
$C$ は $A, B$ と異なる強連結成分に属する
$\rm{order}[A] \lt \rm{order}[B]$
$C$ は $A, B$ の少なくとも一方と隣接している(辺の向きを無視したとき、$C$ と $A, B$ の少なくとも一方を結ぶ辺が存在する)

条件 $3$ は $2$ つのうち order が小さい方を A にすれば良いのでこの条件を課しても一般性を失いません。また、今　DFS tree には $3$ 以上の頂点数と $2$ 以上の強連結成分数がある状況を考えているので、条件 $4$ を満たすような頂点 $C$ が必ず存在します。
すると、上の主張は DFS tree において下図の左の構造しかあり得ないということになります。

$A, B, C$ を選ぶ際の条件 $1, 2$ を無視すると、この図の右の２パターンが考えられるので、これらは条件 $1, 2$ の少なくとも一方を満たせないということを示します。

パターン1の場合
条件 $1$ を満たすと仮定します。このとき、$A$ と $B$ は強連結なので $B$ から $A$ へのパスが存在します。すると、$A \rightarrow C, B \rightarrow C, C \rightarrow A, C \rightarrow B$ のパスが存在することになり、$C$ と $A, B$ も強連結になります。これでは条件 $2$ を満たすことができませんので、このような構造はあり得ません。

パターン2の場合
条件 $2$ を満たすと仮定します。このとき、$A, B$ は $C$ と強連結でないので、$A$ から $C$、$B$ から $C$ へのパスは存在しません。また、$A$ と $B$ は祖先・子孫の関係にないので条件 $1$ を満たすためには $A \rightarrow B, B \rightarrow A$ の cross edge が共に存在する必要があります。条件 $4$ から $A \rightarrow B$ の cross edge は order が大きくなるはずですが前節でみたように、そのような cross edge は存在しません。したがって、条件 $2$ を満たすことができないのでこのような構造はあり得ません。

これで、DFS tree における SCC の構造がわかりました。

4.5. 頂点の特徴づけ②

グラフを DFS tree で表すと各 SCC はそれぞれ、order の最も小さい頂点を根とした根付き木になっていることがわかったので、この根を特別視し、scc_root と呼ぶことにします。

ここまでくると、このアルゴリズムの方針が見えてきます。

DFSの道順を考えると scc_root の帰りがけ(下図の★)の時点で、この scc_root を根とする部分木のうち、SCC id が未確定の頂点たちが、１つの強連結成分を構成していることがわかります。
また重要な点として、この方法では DFS tree の葉に近い方から SCC id が確定していくことが見て取れます。これはトポロジカル順序の逆順に SCC id が付与されていくことを意味しています。
したがって、最後に SCC id を逆転させることで縮約されたグラフでのトポロジカルソートを達成できます。

あとは、ある頂点の帰りがけの時点でその頂点が scc_root かどうかを判定できれば良いことになります。
そのために、scc_root である頂点、そうでない頂点を観察してみます。

まず分かるのは、頂点 $v$ から back edge が出ている場合、頂点 $v$ は scc_root でないということです。なぜなら、back edge をたどった先の頂点 $u$ は $v$ の祖先なので、$\rm{order}[u] \lt \rm{order}[v]$ でありかつ、$u \rightarrow v$ のパス上の頂点は全て強連結だからです。

次に cross edge について考えてみます。頂点 $v$ から頂点 $u$ へ cross edge が出ていて、現在 DFS で頂点 $v$ の帰りがけの時点とします。
まず、頂点 $u$ の SCC id が既に確定している場合を考えます。このときは $v$ と $u$ が別の SCC に属していることくらいしか分かりません。
頂点 $u$ の SCC id が未確定の場合はどうでしょうか。このとき、頂点 $u$ から $u, v$ の共通祖先のどれかへ到達可能です。したがって、$u \rightarrow v, v \rightarrow u$ 双方のパスが存在するので $u, v$ は強連結になります。また、 cross edge の性質から $\rm{order}[u] \lt \rm{order}[v]$ なので、頂点 $v$ は scc_root になり得ません。

最後に tree edge について考えてみます。現在 DFS で頂点 $v$ の帰りがけの時点とします。頂点 $v$ から tree edge のみをたどって到達できる頂点たち（すなわち $v$ の子孫）のうち、既に SCC id が確定している頂点は $v$ とは異なる SCC に属するので考える必要はありません。
一方、SCC id が未確定の子孫は全て $v$ と強連結です。したがって、これらの子孫に $\rm{order}[v]$ よりも $\rm{order}$ が小さい頂点へ到達可能な頂点が存在すれば、$v$ はscc_root になり得ません。

まとめると、頂点 $v$ が scc_root でない条件は

back edge が出ている
帰りがけ時点で未確定の頂点への cross edge が出ている
帰りがけ時点で未確定の子孫のうち、$\rm{order}[v]$ より小さい order の未確定の頂点に到達可能なものが存在する

のうち少なくとも１つを満たすとなります。

このような条件から、各頂点について次のように定義される lowlink と呼ばれる値を導入します:

頂点 $v$ の lowlink とは、DFS での頂点 $v$ の帰りがけの時点で以下の２種類の方法によってたどり着ける、 SCC id が未確定である頂点の order の最小値である。

tree edge を任意の回数使用する
back edge もしくは cross edge を高々１回使用する

この特徴量を導入することで

v\;が\;\rm{scc\_root} \Leftrightarrow order[v] == lowlink[v]

と条件を簡潔に記述できます。

4.6. より一般的なグラフの場合

本記事では簡単のため、具体例として自己ループ、多重辺のない連結なグラフを扱いました。また、DFSを開始する頂点は縮約されたグラフをトポロジカルソートした際に先頭に来るように選びました。

ここではこのような作為的な設定をしなくてもアルゴリズムがうまくいくことを確認します。

自己ループが存在する場合
自己ループをたどっても order の小さい頂点へ行くことはできないので lowlink に影響せず、問題ありません。

多重辺が存在する場合
多重辺のうち lowlink の計算に影響するのは高々 1 本であり、その他の辺は何も影響しないので、辺が 1 本の場合と変わらず多重辺が存在しても問題ありません。

グラフが非連結な場合
ある連結成分内の頂点と別の連結成分内の頂点は当然非連結であるので、SCC を求める際には互いに影響することなく、それぞれ独立に考えることができます。また、非連結な頂点間にはトポロジカル順序が定まらないので、どの連結成分から SCC を求めても良いことが分かります。

トポロジカル順序で先頭でない頂点から始めた場合
下図は今回扱った例の縮約されたグラフです。

ここでは最も頂点番号の大きい頂点 $9$ を DFS の始点に選んでみます。すると、頂点 $9$ の SCC id が $0$ であることが確定します。
次に SCC id が未確定の頂点のうち最も頂点番号の大きい頂点 $8$ を DFS の始点に選んでみます。すると、まずトポロジカル順序で後にくる頂点 $1, 3, 4, 5, 7$ の SCC id が確定し、その後頂点 $6, 8$ が確定します。
最後に未確定の頂点のうち最も頂点番号の大きい頂点 $2$ を DFS の始点に選んでみます。
これで頂点 $0, 2$ の SCC id が確定し、全ての頂点について、トポロジカル順序の逆順に SCC id が決められました。

このように、どの頂点を DFS の始点に選んでも必ずトポロジカル順序の逆順に SCC id が決定されます。
したがって、SCC id が未確定の頂点がある限り、そのような頂点から 1 つ選んで DFS するのを繰り返すことで望んだ結果が得られることが分かりました。

4.7. 実装方法

これで、Tarjan のアルゴリズムは以下の手続きによって強連結成分分解を行うことがわかりました。

while (全ての頂点の SCC id が確定するまで){
    未確定の頂点からDFS
    DFSの最中に以下のことを行う:
        * 行きがけに order を付与
        * lowlink を計算
        * 帰りがけにその頂点が scc_root の場合は
          DFS tree におけるその頂点の部分木のうち
          未確定の頂点に SCC id を付与
}

SCC id を逆順にすることで縮約されたグラフでのトポロジカルソートを達成する

これで ACL の SCC を実装する準備が整いましたが、実装する上でのつまづく可能性のあるポイントを挙げておきます。

1. scc_rootが見つかったとき

一番難しいのは、「ある頂点 $v$ の帰りがけにその頂点が scc_root であるとわかったときに、DFS tree における頂点 $v$ の部分木のうち未確定の頂点に SCC id を付与」という部分だと思います。
実はこれは stack を使うとうまく実装できます。（stack は末尾への append、末尾の pop が高速なデータ構造です。Python ではリストで代用できます。）

DFS の行きがけに頂点を stack に追加していくと、頂点 $v$ の帰りがけ時点で $v$ が scc_root のとき、stack の $v$ 以降の頂点は $v$ の子孫になっているので $v$ までを pop しながらSCC id を付与していくことで目的の操作を実現できます。

2. lowlinkの計算(辺の種類)

lowlinkの定義では　高々１回使えるのは back edge と cross edge のみで、forward edge は使いませんでした。しかし、forward　edge は order が大きくなる方向への辺であり、lowlink の定義は最小値なので forward edge を使ったとしても lowlink の計算には影響しません。
したがって、DFS で辺をたどる際はその辺が tree edge かどうかだけ見れば良いです。これは辺をたどった先の頂点が訪問済みかどうかと同値なので、辺をたどった先の頂点に order が付与されているかどうかを見ればわかります。

3. lowlinkの計算(頂点の種類)

lowlink を更新する際には SCC id が未確定の頂点のみについて行う必要があります。これをそのまま実装しても構いませんが、 ACL では少しの工夫でより簡潔に DFS を記述できるようにしています。
頂点 $v$ から頂点 $u$ への辺が存在し、頂点 $u$ の探索が終了した時点で頂点 $v$ の lowlink を更新する状況を考えます。このとき、頂点 $u$ の SCC id が確定していても確定していない場合と同様に処理するためにはどうすれば良いでしょうか。
まず辺が tree edge の場合を考えます。tree edge は何回でも使えるので

lowlink[v] = min(lowlink[v], lowlink[u])

と更新されます。$u$ は $v$ の子孫なので、もし頂点 $u$ の SCC id が確定しているならば、$lowlink[u] > lowlink[v]$ となります。したがって、頂点 $v$ の lowlink が頂点 $u$ の lowlink を使って更新されることはないので、頂点 $u$ の SCC id が確定しているかどうかを気にせずに計算することができます。

次に辺が tree edge でない場合を考えます。tree edge でない場合は 1 回しか使えないので、使うとしたら最後になります。(tree edge での移動は必ず order が大きくなるので back/cross edge での移動の後にやる意味はありません。)
したがって

lowlink[v] = min(lowlink[v], order[u])

と更新されます。back edge や cross edge は order が小さい頂点と結ばれることがあるため、頂点 $u$ の SCC id が確定している場合にも頂点 $v$ の lowlink が更新されてしまう可能性があります。
そこで SCC id が確定した際に、その頂点の order を min の演算に影響しない ∞ に置き換えることで、SCC id が確定した頂点を実質的に除外することができます。

アルゴリズムを視覚化したものを併せてみると分かりやすいかもしれません。

Tarjan のアルゴリズムで強連結成分分解 pic.twitter.com/SEws6kmGrh
— ぴーそん (@R_olldIce) May 8, 2022

5. 実装

では Python で実装します。変数名等はできるだけ ACL に合わせます。

この記事の冒頭でも述べたように ACL の SCC では

internal_scc : アルゴリズムの実体
scc : internal_scc を使うためのインターフェイス

のような形になっています。

5.1. internal_scc

まずはinternal_scc.pyから実装していきます。
この実装に必要な、internal_csr.py はすでに実装しているものとします。

まず、クラス_SCC_graph を作成し、コンストラクタを記述します。初期化に必要な値は頂点数のみです。Tarjan のアルゴリズムは再帰関数で実装するので再帰上限を変更しておきます。
また、頂点数を返すメソッドnum_vertices()と辺を追加するメソッドadd_edge()も実装します。

import sys
from internal_csr import csr

class _SCC_graph:
    def __init__(self, n):
        self._n = n
        self.edges = []
        sys.setrecursionlimit(max(2*n, sys.getrecursionlimit()))
    
    def num_vertices(self):
        return self._n
    
    def add_edge(self, frm, to):
        """
        from -> to の辺を追加

        Args:
            frm (int): 追加する辺の始点
            to  (int): 追加する辺の終点
        """

        self.edges.append([frm, to])

次に今回の心臓部である Tarjan のアルゴリズムを実装します。

def scc_ids(self):
    """
    Tarjan のアルゴリズムでグラフの強連結成分分解を行う

    Returns:
        group_num (int): グラフの強連結成分数
        ids (List[int]): 各頂点が属する強連結成分のid
    """

    # 辺をcsr形式に変換
    start, elist = csr(self._n, self.edges)

    # 探索した頂点数, 見つかったSCCの数
    now_ord, group_num = 0, 0

    # 探索済みかつidが未確定の頂点を管理するstack
    visited = []
    

    low = [0] * self._n # lowlink
    ord_ = [-1] * self._n # order (-1は未探索を表す)
    ids = [0] * self._n # SCC id

    def dfs(v):
        nonlocal now_ord, group_num, visited, low, ord_, ids

        # 行きがけ:
        #    * orderを付与
        #    * lowlinkをorderで初期化
        #    * stackに追加
        low[v] = ord_[v] = now_ord
        now_ord += 1
        visited.append(v)

        for i in range(start[v], start[v+1]):
            to = elist[i]
            
            # 行き先が未探索の場合(この辺はtree edge)
            if ord_[to] == -1: 
                dfs(to)

                # tree edgeは何回でも使えるので
                # vのlowlink<=toのlowlink
                low[v] = min(low[v], low[to])
            
            # 探索済みの場合 (この辺はtree edgeでない)
            else:
                # tree edgeでない辺は1回しか使えないので
                # 行き先のorderでlowlinkを更新
                low[v] = min(low[v], ord_[to])
        
        # 帰りがけ:
        #    * vがscc_rootのときstackのv以降にSCC idを付与
        #    * orderをn(無限大と同等)に変更しこれ以降
        #      lowlinkの計算に使われないようにする
        if low[v] == ord_[v]:
            while True:
                u = visited.pop()
                ord_[u] = self._n
                ids[u] = group_num
                if u == v: break
            group_num += 1
    

    for i in range(self._n):
        # 未探索の頂点からDFSを行う
        if ord_[i] == -1:
            dfs(i)
        
    # SCC id はトポロジカル順序の逆順に付与されているので反転する
    for i in range(self._n):
        ids[i] = group_num - 1 - ids[i]
    
    return group_num, ids

最後にscc_ids()で決まった SCC id から頂点を SCC 毎にまとめて返すメソッドscc() を実装します。

def scc(self):
    """
    強連結成分分解の結果を整形して返す
    
    Returns:
        groups (List[List[int]]): 各リストがそれぞれSCCに対応。
                                  縮約されたグラフでのトポロジカルソートがされている
    """
    group_num, ids = self.scc_ids()
    groups = [[] for _ in range(group_num)]
    for i in range(self._n):
        groups[ids[i]].append(i)
    return groups

まとめると以下のようになります。

internal_scc.py

import sys
from internal_csr import csr

class _SCC_graph:
    def __init__(self, n):
        self._n = n
        self.edges = []
        sys.setrecursionlimit(max(2*n, sys.getrecursionlimit()))
    
    def num_vertices(self):
        return self._n
    
    def add_edge(self, frm, to):
        self.edges.append([frm, to])
    
    def scc_ids(self):
        start, elist = csr(self._n, self.edges)
        now_ord, group_num = 0, 0
        visited = []
        low = [0] * self._n
        ord_ = [-1] * self._n
        ids = [0] * self._n

        def dfs(v):
            nonlocal now_ord, group_num, visited, low, ord_, ids
            low[v] = ord_[v] = now_ord
            now_ord += 1
            visited.append(v)
            for i in range(start[v], start[v+1]):
                to = elist[i]
                if ord_[to] == -1:
                    dfs(to)
                    low[v] = min(low[v], low[to])
                else:
                    low[v] = min(low[v], ord_[to])
            if low[v] == ord_[v]:
                while True:
                    u = visited.pop()
                    ord_[u] = self._n
                    ids[u] = group_num
                    if u == v: break
                group_num += 1
        
        for i in range(self._n):
            if ord_[i] == -1: dfs(i)
        for i in range(self._n):
            ids[i] = group_num - 1 - ids[i]
        
        return group_num, ids


    def scc(self):
        group_num, ids = self.scc_ids()
        groups = [[] for _ in range(group_num)]
        for i in range(self._n):
            groups[ids[i]].append(i)
        return groups

5.2. scc

次にインターフェイス部分であるscc.pyを実装します。
こちらはinternal_sccのメソッドを呼び出すだけなので全部まとめて実装します。

scc.py

from internal_scc import _SCC_graph as internal

class SCC_graph:
    def __init__(self, n):
        self._n = n
        self._scc_graph = internal(n)
    
    def add_edge(self, frm, to):
        assert 0 <= frm < self._n
        assert 0 <= to < self._n
        self._scc_graph.add_edge(frm, to)
    
    def scc(self):
        return self._scc_graph.scc()

6. 使用例

今回扱ったグラフで実際に使用してみます。

from scc import SCC_graph

# 本記事で扱った具体例
n = 10
E = [
    [0, 1],
    [0, 2],
    [1, 4],
    [2, 6],
    [2, 0],
    [2, 8],
    [3, 5],
    [3, 1],
    [4, 3],
    [4, 7],
    [5, 3],
    [6, 8],
    [6, 7],
    [7, 9],
    [7, 3],
    [8, 6],
    [8, 7],
]

scc_graph = SCC_graph(n)

for a, b in E:
    scc_graph.add_edge(a, b)

groups = scc_graph.scc()
print(groups) # [[0, 2], [6, 8], [1, 3, 4, 5, 7], [9]]

7. verify用の問題

verify用の問題が AtCoder Library Practice Contest にあります。

AtCoder Library Practice Contest G-SCC

考察要素はないのでそのまま使うだけです。

n, m = map(int, input().split())

# 頂点数nで初期化
scc_graph = SCC_graph(n)

# 辺の追加
for _ in range(m):
    a, b = map(int, input().split())
    scc_graph.add_edge(a, b)

# SCCを求める
groups = scc_graph.scc()

# 答えの出力
n_scc = len(groups)
print(n_scc)
for i in range(n_scc):
    g = groups[i]
    print(len(g), ' '.join(map(str, g)))

提出 : Python (3.8.2) - 3519ms

制限時間 $5000\rm{ms}$ に対して $3519\rm{ms}$ で無事 AC できました。

また、PyPy は再帰関数が苦手と言われていますが、この問題では十分高速に実行されました。

提出 : PyPy3(7.3.0) - 1587ms

ちょっとした高速化
Pythonではmin()関数のコストが結構大きいので if 文で代用すると少し高速化できます。また、internal_scc を直接扱うことでも若干の高速化ができます。

提出 : Python (3.8.2) - 3206ms

$300\rm{ms}$ 程度速くなりました。

8. おわりに

今回は Tarjan のアルゴリズムによる強連結成分分解を見てきました。

説明の間違いやバグ、アドバイス等ありましたらお知らせください。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

【SCC編】AtCoder Library 解読 〜Pythonでの実装まで〜