09 Sort

요약

정렬	Best	Average	Worst	In-place	Stable
선택	$O (n^{2})$	$O (n^{2})$	$O (n^{2})$	O	X
삽입	$O (n)$	$O (n^{2})$	$O (n^{2})$	O	O
버블	$O (n)$	$O (n^{2})$	$O (n^{2})$	O	O
퀵	$O (n lo g n)$	$O (n lo g n)$	$O (n^{2})$	O	X
병합	$O (n lo g n)$	$O (n lo g n)$	$O (n lo g n)$	X	O
힙	$O (n lo g n)$	$O (n lo g n)$	$O (n lo g n)$	O	X
기수	$O (d n)$	$O (d n)$	$O (d n)$	X	O

1. 정렬(Sort)

정렬: 레코드(키+필드)를 키의 순서대로 재배열하는 작업
- 모든 경우에 최적인 정렬 알고리즘은 없음
- 데이터의 형식, 수, 크기에 따라 적합한 방법 선택
레코드(record): 하나의 데이터 단위
- 키(key): 정렬 기준이 되는 필드
- 필드(field): 레코드를 구성하는 각각의 정보 항목

1.1. 정렬 관련 용어

우수한 정렬 알고리즘의 성질
- 제자리 정렬(in-place): 입력 배열 외에 추가 메모리를 거의 사용하지 않는 정렬
- 안정 정렬(stable): 같은 키 값을 가진 레코드들의 상대적 순서가 유지되는 정렬
모든 데이터가 메모리에 올라오는가?
- 내부 정렬: 모든 레코드가 메인 메모리에 올라와 있는 정렬
- 외부 정렬: 대부분의 데이터가 외부 기억 장치에 있고, 일부만 메모리에 올라와 있는 대규모 정렬
가정: 본 장에서는 정수형 키를 가진 1차원 배열을 오름차순으로 정렬하는 경우를 다룹니다.

2. 비교 정렬(comparison)

2.1. $O (n^{2})$

(1) 선택 정렬(selection)

step: 1 to n-1
comp: (step에 따라, 항상) n-1 to 1
swap: O (제자리 정렬)

void selection_sort(int arr[], int n) {
    for (int i = 0; i < n-1; i++) {
        int min = i;
        for (int j = i+1; j < n; j++)
            if (arr[j] < arr[min]) min = j;
        swap(&arr[i], &arr[min]);
    }
}

(2) 삽입 정렬(insertion)

step: 2 to n
min_comp: 1
max_comp: (step에 따라) 1 to (n-1)
swap: O (제자리 정렬)

void insertion_sort(int arr[], int n) {
    for (int i = 1; i < n; i++) {
        int j = i;
        while (j > 0 && arr[j-1] > arr[j]) {
            swap(&arr[j], &arr[j-1]);
            j--;
        }
    }
}

(3) 버블 정렬(bubble)

step: 1 to n-1
min_comp: 1
max_comp: (step에 따라) (n-1) to 1
swap: O (제자리 정렬)

void bubble_sort(int arr[], int n) {
    for (int i = 0; i < n-1; i++)
        for (int j = 0; j < n-1-i; j++)
            if (arr[j] > arr[j+1])
                swap(&arr[j], &arr[j+1]);
}

2.2. $O (n lo g n)$

(1) 병합 정렬(merge)

분할 정복(divide and conquer)
- 분할: 분할 비용 $n - 1$
- 정복/병합: 각 recursion depth( $⌈ l o g_{2} n ⌉$ )마다 병합 비용 $n$
- 시간 복잡도: $O (n lo g n) = n + n lo g n$
- 공간 복잡도: 병합 시 정렬된 배열을 따로 생성하는 비제자리 정렬 $O (n)$

void merge_sort(int arr[], int low, int high) {
    if (low < high) {
        int mid = (low+high)/2;
        merge_sort(arr, low, mid);
        merge_sort(arr, mid+1, high);
        merge(arr, low, mid, high);
    }
}
 
void merge(int arr[], int l, int m, int r) {
    int n1 = m-l+1, n2 = r-m;
    int L[100], R[100]; // subarray L, R
    for (int i = 0; i < n1; i++) L[i] = arr[l + i];
    for (int i = 0; i < n2; i++) R[i] = arr[m + 1 + i];
    
    int i = 0, j = 0, k = l;
    while (i < n1 && j < n2)
        arr[k++] = (L[i] <= R[j]) ? L[i++] : R[j++]; // 조건?참:거짓
    while (i < n1) arr[k++] = L[i++]; // 남은 배열 소진
    while (j < n2) arr[k++] = R[j++]; // 남은 배열 소진
}

(2) 퀵 정렬(quick)

Divide and Conquer
comp: n
recursion depth: $⌈ l o g_{2} n ⌉$ (best) ~ $n$ (worst: pivot이 min/max일 때)
- median of three: pivot을 왼쪽, 가운데, 오른쪽 중 중간값으로 사용
swap: O (제자리 정렬)
불안정 정렬
알고리즘
1. 좌우에서 포인터를 이동시키며, 피벗보다 큰 값·작은 값을 교환
2. 두 포인터가 교차하면 분할 완료

void quick_sort(int arr[], int low, int high) {
    if (low < high) {
        int pivot = partition(arr, low, high);
        quick_sort(arr, low, pivot-1);
        quick_sort(arr, pivot+1, high);
    }
}
 
int partition(int arr[], int low, int high) {
    int pivot = arr[high];
    int i = low;
    for (int j = low; j < high; j++) {
        if (arr[j] < pivot) swap(&arr[i++], &arr[j]);
    }
    swap(&arr[i], &arr[high]);
    return i;
}

퀵 정렬 라이브러리 함수
- qsort(): C 기본 라이브러리 제공, 함수 포인터로 비교 함수를 전달하며 내부적으로 퀵 정렬 계열 알고리즘을 사용

(3) 힙 정렬(heap)

이진 트리 vs. 힙
- 힙
  - 완전 이진 트리
    - 위에서 아래로, 왼쪽에서 오른쪽으로 노드를 배치한 형태
  - 부모의 노드가 자식보다 크거나 같다.
- 최대 힙(max heap): 루트가 최댓값이 되도록 구성
기본 개념
- 힙(Heap): 완전 이진 트리를 기반으로 한 자료구조로, 부모 노드가 자식 노드보다 항상 크거나(최대 힙) 작아야(최소 힙) 한다는 규칙을 가집니다.
- 최대 힙(Max Heap): 부모 노드의 값이 자식 노드의 값보다 항상 큽니다. 루트 노드에 최댓값이 위치합니다.
- 최소 힙(Min Heap): 부모 노드의 값이 자식 노드의 값보다 항상 작습니다. 루트 노드에 최솟값이 위치합니다.
정렬 과정
1. 힙 생성(Build Heap)
  - 주어진 데이터(배열)를 최대 힙 구조로 만든다.
  - (루트 노드에 최댓값이 오도록 구성)
  - 부모노드가 자식노드보다 큰 트리, 단말 노드를 자식노드로 가진 부모노드부터 구성하며 아래부터 루트까지 올라오며 순차적으로 만들어 갈 수 있다.
2. 정렬 반복
  - 루트와 마지막 교환: 현재 힙의 루트(최댓값)를 마지막 노드와 교환한다.
  - 크기 감소: 힙의 크기를 1 줄여서, 가장 마지막으로 이동한(정렬 완료된) 최댓값을 힙에서 제외한다.
  - 재구성(Heapify): 힙의 규칙이 깨졌으므로, 다시 루트 노드부터 아래로 내려가며 힙 구조를 유지하도록 재조정한다.
3. 반복
  - 힙의 원소가 하나가 남을 때까지 위 과정을 반복한다.
주요 특징
- 시간 복잡도
  - 최악, 평균, 최선 모든 경우에 $O (n lo g n)$ 의 성능을 보인다.
- 공간 복잡도
  - 추가적인 배열을 생성하지 않고 입력 배열 내에서 정렬을 수행하는 제자리 정렬(In-place sort) 알고리즘이므로 $O (1)$ 의 추가 공간(메모리)만 사용한다.
- 안정성(Stability): 동일한 값을 가진 원소들의 원래 순서가 정렬 후에는 유지되지 않을 수 있는 불안정 정렬이다.

3. 비비교 정렬(non-comparison)

3.1. 기수 정렬(radix)

비교 기반 정렬의 한계를 넘어, 키의 자리수(digit)에 따라 버킷(bucket)에 분배한 뒤 다시 모으는 과정을 반복하는 방식이다.
LSD(Least Significant Digit) 방식: 가장 낮은 자리수부터 높은 자리수 순으로 안정적 정렬
MSD(Most Significant Digit) 방식: 가장 높은 자리수부터 낮은 자리수 순으로 분할 정복

for (d = 0; d < max_digits; d++) {
    // 각 원소를 d번째 자리수 값에 따라 10개의 큐에 분배
    distribute(a, buckets, d);
    // 버킷 순서대로 a[]에 다시 복귀
    collect(a, buckets);
}

시간 복잡도: O(dn), 실제 d(자릿수)가 작아 선형 시간에 가까움
특징
- 버킷 방식으로 안정성을 만족
- 버킷(추가 큐)로 인한 비제자리 정렬
- 한정된 키 타입(동일 길이 숫자, 단순 문자 등)에만 적용 가능

4. 함수 포인터

비교 기준을 함수 포인터로 전달하여, 다양한 기준으로 동일한 정렬 알고리즘을 적용할 수 있는 기법입니다.
Lab 9.1: 2차원 좌표 구조체에 대해 x-좌표, y-좌표, 거리 기준 등 다양한 비교 함수를 구현하고, 삽입 정렬이나 qsort()에 전달하여 정렬

int x_ascend(Element a, Element b) { // x 오름차순
	return (b.x - a.x);
}
int y_descend(Element a, Element b) { // y 내림차순
	return (a.y - b.y);
}
int z_ascend(Element a, Element b) { // 크기의 오름차순
    return ((b.x * b.x + b.y * b.y) - (a.x * a.x + a.y * a.y));
}
 
void insertion_sort_fn(Element A[], int n, int(*f)(Element, Element)) {
    for (int i = 1; i < n; i++) {
        Element key = A[i];
        int j;
        for (j = i - 1; j >= 0; j--) {
            if (f(A[j], key) < 0) A[j + 1] = A[j];
            else break;
        }
        A[j + 1] = key;
    }
}
 
void main() {
    Element list[9] = {
	    {6,6}, {7,4}, {2,3}, {1,5}, {5,2}, {3,3}, {9,4}, {1,8}, {5,3}
	};
    insertion_sort_fn(list, 9, x_ascend);
    insertion_sort_fn(list, 9, y_descend);
    insertion_sort_fn(list, 9, z_ascend);
}

Archive

탐색기

09 Sort

요약

1. 정렬(Sort)

1.1. 정렬 관련 용어

2. 비교 정렬(comparison)

2.1. $O (n^{2})$

(1) 선택 정렬(selection)

(2) 삽입 정렬(insertion)

(3) 버블 정렬(bubble)

2.2. $O (n lo g n)$

(1) 병합 정렬(merge)

(2) 퀵 정렬(quick)

(3) 힙 정렬(heap)

3. 비비교 정렬(non-comparison)

3.1. 기수 정렬(radix)

4. 함수 포인터

그래프 뷰

목차

Archive

탐색기

09 Sort

요약

1. 정렬(Sort)

1.1. 정렬 관련 용어

2. 비교 정렬(comparison)

2.1. O(n2)

(1) 선택 정렬(selection)

(2) 삽입 정렬(insertion)

(3) 버블 정렬(bubble)

2.2. O(nlogn)

(1) 병합 정렬(merge)

(2) 퀵 정렬(quick)

(3) 힙 정렬(heap)

3. 비비교 정렬(non-comparison)

3.1. 기수 정렬(radix)

4. 함수 포인터

그래프 뷰

목차

2.1. $O (n^{2})$

2.2. $O (n lo g n)$