LoginSignup
1
0

More than 5 years have passed since last update.

要素数nのリストに対してのクイックソートの効率を可視化

Last updated at Posted at 2018-12-08

はじめに

入門書を何冊か読んでみたけど、そこからはみ出たことがなかなかできないといった方は多くいると思います。自分も独学でプログラミングの勉強をしておりそのような悩みを抱えていたため、このような記事を書いてみました。
現時点では、あまり初学者に有益な情報はないかもしれませんが、これから少しずつ追記していく予定です。

この記事は、「問題解決のPythonプログラミング
――数学パズルで鍛えるアルゴリズム的思考
」の内容を基にして書いています。

この記事の内容

問題解決のpythonプログラミング」p146の練習問題の中に、3種類の方法で作成した要素数n個リストについて、それぞれのループ回数を計算せよ。といった内容のものがあったのですが、せっかく計算したのでそれを可視化して、比較してみよう!というのが本記事の内容となっています。

それでは実践!

クイックソートのアルゴリズムについて

quickSort.py
def quickSort(lst, start, end):
    '''
    lst: ソートするリスト
    start: pivotと比較していくリストの範囲の先頭の番号。初期値は必ず0
    end: pivotと比較していくリストの範囲の最後の番号。lstの要素数 - 1
    '''
    global move
    if start < end:
        split, move = pivotPartition(lst, start, end)
        quickSort(lst, start, split - 1)
        quickSort(lst, split + 1, end)
    return lst, move

def pivotPartition(lst, start, end):
    global move
    pivot = lst[end]
    bottom = start - 1
    top = end
    done = False
    while not done:
        while not done:
            move += 1
            bottom += 1
            if bottom == top:
                done = True
                break
            if lst[bottom] > pivot:
                lst[top] = lst[bottom]
                #move += 1  if分の中で移動度をカウントすると、
                           #ソートの効率が正確に測れないので、コメントアウト
                break
        while not done:
            move += 1
            top -= 1
            if top == bottom:
                done = True
                break
            if lst[top] < pivot:
                lst[bottom] = lst[top]
                #move += 1  if分の中で移動度をカウントすると、
                           #ソートの効率が正確に測れないので、コメントアウト
                break
    lst[top] = pivot
    return top, move

move = 0 #移動度をグローバル変数で定義
D = list(range(i, -1, -1)) #降順のリストを作成
sorted_list, move = quickSort(D, 0, len(D) - 1) #クイックソートを行う

このプログラムでは、内側のwhileループの回数を移動度moveとして定義しています
この移動度moveを縦軸、リストの長さを横軸として、グラフを作成していくこととします。

問題解決のpythonプログラミング」p137~p145でクイックソートのアルゴリズムについて解説されているため、詳しい部分については省略させていただきます。

まずはシンプルに

最初に、降順のリストのみで、グラフを作成してみます。
コードはこんな感じです。

gurafu.py
import numpy as np
import matplotlib.pyplot as plt
import numpy as np

Move = np.array([0])
Num = np.array([0])
for i in range(100):
    move = 0 #移動度をグローバル変数で定義
    D = list(range(i, -1, -1)) #降順のリストを作成
    sorted_list, move = quickSort(D, 0, len(D) - 1)
    Move = np.append(Move, move)
    Num = np.append(Num, i)

fig, ax = plt.subplots()
ax.plot(Num, Move)

これの出力結果が以下の様になります。
       image.png
     図1 降順リストをクイックソートでソートした場合の移動度

二種類の方法で作ったリストを比較

数値がランダムなリスト100個は以下のように作成した。

random_list.py
Move_R = np.array([0])
#ランダムなリストRを作成
for i in range(1, 101):
    move = 0 # 移動度をグローバル変数で定義
    R = [0] * i
    R[0] = 29
    for j in range(i):
        R[j] = (9679 * R[i-1] + 12637 * j) % 2287
    sorted_list, move = quickSort(R, 0, len(R) - 1)
    Move_R = np.append(Move_R, move)

これまでに作成した乱数のリストRと降順リストLを比較していくことで、クイックソートの効率を分析していこうと思う。
ここで、比較を行うために、複数のグラフを同一の領域に描画する必要があるのだが、やり方はとても簡単で、単純に2度描画関数を呼ぶだけである。
そのためgurafu.pyの変更部分はこれだけ!

gurafu2.py
fig, ax = plt.subplots()
plt.plot(Num, Move, label = "Descending")
plt.plot(Num, Move_R, label = "Random")

plt.legend()

      image.png
       図2 2種類の方法で作成したリストのソート効率の比較

このグラフから、乱数のソートにおいて、クイックソートはとても安定したアルゴリズムであることが確認できたが、降順のリストにおいては、効率があまりよくないことが確認できた。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0