3
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Pythonで学ぶアルゴリズム 第10弾:二分探索

Posted at

#Pythonで学ぶアルゴリズム< 二分探索 >

##はじめに
基本的なアルゴリズムをPythonで実装し,アルゴリズムの理解を深める.
その第10弾として二分探索を扱う.

##二分探索
中央値など,ある値を見たときに,その値がそれよりも前か後ろかを判断する.
・探索範囲が半分(二分割)ずつ狭まっていく ⇒ 高速化
※注意
データが五十音順など規則的に並んでいる必要がある
場合によって事前にデータの並び替えが必要となることもある

##線形探索との違い
オーダーを示すと,次のようになる.
線形探索:$O(n)$
二分探索:$O(log_2n)$
より直感的に理解するためにその関係をグラフに示す.
image.png

例えば,データが1000個,100万個あったとすると,線形探索では1000回,100万回の比較が必要だが,二分探索では10回,20回の比較だけでよくなる.

規則正しくデータが並べられている必要があるという制約はあるものの,データが多くなった時には,二分探索が有効であることが分かる.ただし,データが少ない時には,速度に大きな差はないため,データの並びに関係ない線形探索が用いられることも少なくない.

##実装
二分探索について2つの実装をする.1つ目は規則正しく並べれられたデータが与えられた場合,2つ目はソート可能であるが,不規則に並べられ並び替えの処理が必要な場合を想定している.以下にコードとその出力を示す.

#####コード1

binary_search.py
"""
2020/12/22
@Yuya Shimizu

二分探索
"""

def binary_search(data, target):
    left = 0                    #探索する範囲の左端を設定
    right = len(data) - 1       #探索する範囲の右端を設定

    while left <= right:
        mid =  (left + right) // 2         #探索する範囲の中央値
        if data[mid] == target:
            return mid                     #中央値と一致した場合はその位置を返す
        elif data[mid] < target:
            left = mid + 1                 #中央値よりも大きい場合は探索範囲の左端を変える
        else:
            right = mid - 1                #中央値よりも小さい場合は探索範囲の右端を変える

    return False


if __name__ == '__main__':
    data = [10, 20, 30, 40, 50, 60, 70, 80, 90]
    target = 5
    
    found = binary_search(data, target)
    if not found:
        print(f"{target} is not found in the data")
    else:
        print(f"{target} is found at data[{found}]")

#####出力(データが見つかったとき)

50 is found at data[4]

#####出力(データが見つらなかったとき)

5 is not found in the data

#####コード2

binary_search.py
"""
2020/12/22
@Yuya Shimizu

二分探索
"""

def binary_search(data, target):
    data_sorted = sorted(data)  #データを昇順に並び替え sorted(data, reverse=True)とすれば降順にできる
    
    left = 0                    #探索する範囲の左端を設定
    right = len(data) - 1       #探索する範囲の右端を設定

    while left <= right:
        mid =  (left + right) // 2         #探索する範囲の中央値
        if data_sorted[mid] == target:
            return mid , data_sorted       #中央値と一致した場合はその位置と並び変えたデータを返す
        elif data_sorted[mid] < target:
            left = mid + 1                 #中央値よりも大きい場合は探索範囲の左端を変える
        else:
            right = mid - 1                #中央値よりも小さい場合は探索範囲の右端を変える

    return False, -1


if __name__ == '__main__':
    data = [10, 50, 60, 20, 30, 40, 90, 70, 80]
    target = 50
    
    found, data_sorted = binary_search(data, target)

    if not found:
        print(f"{target} is not found in the data")
    else:
        print(f"data_sorted is the sorted data : \n{data} >>> {data_sorted}\n")
        print(f"{target} is found at data_sorted[{found}]")

#####出力(データが見つかったとき)

data_sorted is the sorted data : 
[10, 50, 60, 20, 30, 40, 90, 70, 80] >>> [10, 20, 30, 40, 50, 60, 70, 80, 90]

50 is found at data_sorted[4]

#####出力(データが見つらなかったとき)

5 is not found in the data

2つ目は必要であるか分からないが,ソートも含めて行う関数を作るならこんな感じかなと試しに作った.ソート可能なデータリストであればうまくいくと思う.繰り返し,左端や右端を中央値と入れ替えることで探索範囲の縮小を行っている.

##感想
線形探索とこれほどまでに違いがあるということを知った.仕組みからして当たり前ではあるが,グラフに表すことでそのことをより直感的に理解することができた.

##参考文献
Pythonで始めるアルゴリズム入門 伝統的なアルゴリズムで学ぶ定石と計算量
                         増井 敏克 著  翔泳社

3
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?