데이터 분석/알고리즘

이진 탐색 알고리즘

김각도 2022. 11. 3. 13:58
반응형

(youtube 동빈나 이코테 강의
https://www.youtube.com/watch?v=94RC-DsGMLo&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC&index=5) 

 

이진 탐색 알고리즘

- 순차 탐색 : 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인하는 방법
- 이진 탐색 : 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법 (시작점, 끝점, 중간점을 이용하여 탐색 범위를 설정)

이진 탐색 ex) 이미 정렬된 10개의 데이터 중 값이 4인 원소를 찾는 예시

0 2 4 6 8 10 12 14 16 18       # 시작점, 중간점(소수점 제거), 끝점
0 2 4 6
4
6       

 

이진 탐색의 시간 복잡도

- 단계마다 탐색 범위를 2로 나누는 것과 동일하므로 연산 횟수는 log2 N에 비례
- 예를 들어 초기 데이터 개수가 32개라면, 이상적으로 1단계를 거치면 16개가 남음
- 다시 말해 이진 탐색은 탐색 범위를 절반씩 줄이며, 시간 복잡도는 O(logN)을 보장

 

이진 탐색 파이썬 소스 코드 (재귀적 구현)

def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2

    if array[mid] == target:           # target을 찾은 경우 중간 인덱스 반환
        return mid
    elif array[mid] > target:          # target보다 중간점의 값이 큰 경우 왼쪽 확인
        return binary_search(array, target, start, mid -1)
    else:                                      # target보다 중간점의 값이 큰 경우 오른쪽 확인
        return binary_search(array, target, mid+1, end)

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print('원소가 존재하지 않습니다.')
else:
    print(result+1)

 

이진 탐색 파이썬 소스 코드 (반복문 구현)

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2

    if array[mid] == target:           # target을 찾은 경우 중간 인덱스 반환
        return mid
    elif array[mid] > target:          # target보다 중간점의 값이 큰 경우 왼쪽 확인
        return binary_search(array, target, start, mid -1)
    else:                                      # target보다 중간점의 값이 큰 경우 오른쪽 확인
        return binary_search(array, target, mid+1, end)

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print('원소가 존재하지 않습니다.')
else:
    print(result+1)

 

파이썬 이진 탐색 라이브러리

- bisect_left(a, x): 정렬된 순서를 유지하면서 배열 a에 삽입할 가장 왼쪽 인덱스를 반환
- bisect_right(a, x): 정렬된 순서를 유지하면서 배열 a에 삽입할 가장 오른쪽 인덱스를 반환

from bisect import bisect_left, bisect_right
a = [1, 2, 4, 4, 8]
x = 4
print(bisect_left(a, x))       >>>   2
print(bisect_right(a, x))     >>>   4

 

ex) 값이 특정 범위에 속하는 데이터 개수 구하기

from bisect import bisect_left, bisect_right

def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index

a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]

print(count_by_range(a, 4, 4))        >>>    2
print(count_by_range(a, -1, 3))       >>>    6

 

파라메트릭 서치

- 파라메트릭 서치란 최적화 문제를 결정 문제('예' 혹은 '아니오')로 바꾸어 해결하는 기법
- ex) 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제
- 일반적으로 코딩 테스트에서 파라메트릭 서치 문제는 이진 탐색으로 해결 가능

반응형