Комп'ютерна графіка та обчислювальна геометрія - 5.3. Найближча пара

5.3. Найближча пара - метод "розподіляй та володарюй".

Нижня оцінка задачі "найближча пара" має складність Ω(Nlog N). Для побудови алгоритмів з такою оцінкою є два шляхи: безпосереднє використання сортування і використання метода "розподіляй та володарюй".
Перший підхід можна відразу відкинути, так як сортування зручне лише в умовах повної впорядкованості, яка полягає у проектуванні усіх точок на деяку пряму, але при цьому втрачається суттєва в даному випадку інформація. Це демонструє малюнок 5.7, на якому точки р₁, р₂ утворюють найближчу пару, але при цьому дають максимальну відстань при проектуванні на вісь y.

Мал. 5.7. Точки р₁ і р₂, які утворюють найближчу пару мають найбільшу відстань по y-координаті.

Другий шлях для досягнення складності Ω(Nlog N) полягає в розбитті задачі на дві підзадачі, розв'язок яких можна об'єднати за лінійний час, отримавши рішення вихідної задачі. Позначивши через P(N, 2) час роботи алгоритму, який шукає найближчу пару точок на площині, отримаємо рекурентне співвідношення:

P(N, 2) = 2P(N/2, 2) + O(N²)

(5.1)

Розв'язком цього співвідношення є P(N, 2) = O(N²), що не дає бажану оцінку.

Алгоритм "розподіляй та володарюй"

Одновимірний випадок. Алгоритм впорядковує точки множини, а потім проглядає її за лінійний час.

Мал.5.8. Метод "розподіляй та володарюй" в одновимірному випадку.

Нехай точка m розбиває множину на дві підмножини S₁ та S₂ і при цьому p < q для всіх p

S₁ i q

S₂. Розв'язавши окремо рекурсивно задачу про найближчу пару для множин S₁ та S₂, отримаємо дві найближчі пари точок {p₁, p₂} i {q₁, q₂} відповідно. Нехай δ₁ = min(S₁)= | p₂ - p₁ | і d₂ = min (S₂)=| q₂ - q₁ | - відстані для знайдених пар відповідно. Позначимо через δ найменшу серед знайдених δ₁ і δ₂ відстаней:

δ = min (δ₁, δ₂) = min(δ| p₂ - p₁ |, | q₂ - q₁ |)

(5.2)

Найближчою парою є {p₁, p₂} або {q₁, q₂}, або {p₃, q₃}, де р₃ = max(S₁), q₃ = min(S₂).
Для того щоб відстань, яку визначає пара {p₃, q₃}, була менше δ, p₃ i q₃ повинні бути на відстані, яка не перевищує δ від точки m (|p₃ - q₃| < δ

|p₃ - m| < δ або |q₃ - m| < δ) . Відкладемо ліворуч і праворуч відносно точки m відрізки довжиною δ.
Скільки ж точок множини S₁ можуть міститись в інтервалі (m - δ, m]? Так як кожен напіввідкритий інтервал довжиною δ містить не більше однієї точки множини S₁, то інтервал (m - δ, m] містить не більше однієї точки. Аналогічно інтервал [m, m + δ). Очевидно, що усі точки, які потрапляють в інтервали (m - δ, m] та [m, m + δ), можна визначити, переглянувши множину за лінійний час. Отже визначивши

dist(max(S₁), min(S₂)) = |p₃ - q₃|,

знайдемо остаточно

δ* = min(δ(S₁), δ(S₂), dist(max(S₁), min(S₂))) = min(| p₂ - p₁|, |q₂ - q₁|, |p₃ - q₃|)

(5.3)

а значить і найближчу пару точок. Таким чином отримаємо наступний алгоритм зі складністю O(N log N).

Двовимірний випадок. Узагальнення на двовимірний випадок можна виконати безпосередньо. Розіб'ємо множину точок на площині S на дві підмножини S₁ і S₂ вертикальною прямою l , яка є медіаною множини S за x-координатою так, щоб кожна точка множини S₁ лежала лівіше будь-якої точки S₂. Розв'язавши рекурсивно задачу для S₁ і S₂, одержимо числа δ₁, δ₂ - мінімальні відстані для множин S₁ і S₂ відповідно. Покладемо δ = min(δ₁, δ₂).
Якщо найближчу пару утворюють точки р

S₁ і q

S₂, то відстань від точок q і p до l не перевищує δ. Позначимо через Р₁ і Р₂ вертикальні смуги шириною δ, розташовані відповідно ліворуч та праворуч від l, то р

S₁ і q

S₂, мал. 5.9.

Мал. 5.9. Метод "розподіляй та володарюй" у випадку площини.

На прямій було не більше одного кандидата для q і p. У процедурі БПАРА1 є точно один кандидат для р: р = max(S₁). На площині таким кандидатом може бути будь-яка точка, якщо вона знаходиться на відстані не більшій за δ від прямої l. На мал. 5.10 наведено приклад такої множини.

Мал. 5.10. Усі точки можуть знаходитсь на відстані, яка не перевищує δ від прямої l.

Мал. 5.11. Для кожної точки із Р₁ необхідно перевірити не більше шести точок із Р₂.

Розглянемо в смузі Р₁ довільну точку р. Необхідно знайти усі точки q із Р₂, які віддалені від p не більше ніж на δ. Усі вони розташовуються у прямокутнику R розміром δ × 2δ. Максимальна кількість точок, які можна помістити в такий прямокутник так, щоб відстань між ними була не менша за δ, рівна 6. Це означає, що для кожної точки із Р₁ необхідно досліджувати лише не більше 6 точок із Р₂. Тому на кроці злиття розв'язків підзадач необхідно виконати не більше 6 × N / 2 = 3N порівнянь у порівнянні з N ²/ 4.
Спроектуємо точку р і усі точки із Р₂ на пряму l. Для визначення точок із Р₂, які потрапили в R, можна розглянути лише проекції точок, які знаходяться на відстані не більшій за δ від проекції точки р. Якщо точки впорядковані за у-координатою, то для усіх точок із Р₁ "кандидати" на місце їх найближчого сусіда із Р₂ визначаються за один прохід впорядкованого списку.

procedure НПАРА2(S)

розбити S на дві підмножини S₁ та S₂ вертикальною прямою l (медіаною).
Рекурсивно знайти відстань для найближчих пар δ₁ та δ₂.
δ := min (δ₁, δ₂).
Нехай Р₁ - множина точок із S₁, які лежать в смузі на відстані δ від розділяючої прямої l, а Р₂ - аналогічна підмножина в S₂. Спроектувати Р₁ та Р₂ на l та впорядкувати проекції за у-координатою. Нехай Р₁* та Р₂* - відповідні впорядковані послідовності.
"Злиття" можна виконати переглядом кожної точки з Р₁*, вивчаючи точки з Р₂*, які знаходяться на відстані, що не перевищує δ. Поки вказівник просувається послідовністю Р₁*, вказівник на Р₂* переміщується вперед-назад, залишаючись в інтервалі шириною 2δ . Нехай δ₁ - мінімальна відстань між парою точок.
δ_S := min(δ, δ_l).

Якщо позначити через Т(N) час обробки алгоритмом множини із N точок, то час, який пішов на обробку на кроці 1 та 5 дорівнює O(N), на кроці 3 та 6 - О(1), а крок 2 потребує часу 2T(N/2). Скориставшись попереднім сортуванням для часу обробки P(N, 2) алгоритму пошуку найближчої пари, отримаємо співвідношення:

P(N, 2) = 2P(N/2, 2) + O(N) = O(N log N)

(5.5)

На основі співвідношення маємо теорему:

Теорема 5.4. Найкоротша відстань, яка визначається N точками на площині, може бути знайдена за час θ(N log N) і є оптимальна.

function НПАРА1(S)
begin if (|S| = 2) then δ := | X[2] - X[1] |
         else if (|S| = 1) then δ := ∞
            else  begin m:= Медіана(S);
                 Побудувати (S₁, S₂) (*S₁ = {p: p  m},  S₂ = {p: p > m}*);
                 δ₁ := НПАРА(S₁);
                 δ₂ := НПАРА(S₂);
                 p := max (S₁);
                 q := min (S₂);
                 δ := min (δ₁, δ₂, q - p)
         end;
     return δ  
end.

Попередня

Змiст

Наступна