Узгодження множин точок![]() Узгодження множин точок (англ. point set registration, англ. point matching) у теорії розпізнавання образів та комп'ютерному зорі є процесом знаходження просторового перетворення, яке узгоджує дві множини точок. Метою знаходження такого перетворення є злиття декількох множин точок у глобально цілісну модель і відображення нового вимірювання на відомий набір даних для виявлення ознак або оцінювання його положення[en]. Множина точок може бути вхідними даними з 3D-сканера або масивом, отриманим від далекоміра. Для використання в обробці зображень і реєстрації зображень на основі ознак, множина точок може бути множиною ознак, отриманою виділянням ознак із зображення, наприклад, виявленням кутів. Узгодження множин точок має широке застосування в оптичному розпізнаванні символів,[1] [2] у доповненій реальності[3] та суміщенні даних магнітно-резонансної томографії зі знімками комп'ютерної томографії.[4][5] ФормулюванняПроблему можна узагальнити наступним чином:[6] Нехай — це дві множини точок скінченного розміру у скінченновимірному дійсному векторному просторі , які містять і точок відповідно (наприклад, демонструє типовий випадок, коли і є множинами 3D-точок). Завдання полягає в тому, щоб знайти таке перетворення, яке буде застосовано до рухомої «моделі» множини точок так, щоб різниця (зазвичай визначається як евклідова відстань) між та статичною множиною об'єктів «сцени» була зведена до мінімуму. Іншими словами, потрібно знайти відображення з на , яке дає найкраще вирівнювання між трансформованими «модельною» множиною та множиною «сцени». Відображення може складатися з жорсткого[en] або нежорсткого перетворення. Модель перетворення можна записати як , за допомогою якої перетворена та узгоджена множина точок моделі матиме вигляд:
Таким чином, результатом алгоритму узгодження множин точок є оптимальне перетворення таке, що найкраще вирівнюється по відповідно до поняття функції відстані : де використовується для позначення набору всіх можливих перетворень, які намагається знайти оптимізація. Найпоширенішим вибором функції для обчислення відстані є квадрат евклідової відстані для кожної пари точок:
де вказує на довжину вектора, а — на відповідну точку в множині , яка досягає найкоротшої відстані до даної точки у множині після перетворення. Мінімізація такої функції у випадку жорсткого перетворення[en] еквівалентна методу найменших квадратів. Види алгоритмівЯкщо співвідношення (тобто, ) відомі до оптимізації, наприклад, за допомогою методів зіставлення ознак, тоді оптимізація має на меті лише оцінити перетворення. Цей тип узгодження називається узгодженням на основі відповідностей (заочне узгодження). З іншого боку, якщо відповідності невідомі, то оптимізації потрібно одночасно знайти відповідності та перетворення. Цей тип узгодження називається одночасним узгодженням положення та відповідності. Жорстке узгодженняЗа допомогою жорсткого узгодження можна отримати жорстке перетворення[en], яке відображає одну множину точок нанесену на іншу. Жорстке перетворення визначається як перетворення, яке не змінює відстань між будь-якими двома точками. Зазвичай така трансформація складається з паралельного перенесення та обертання.[2] У рідкісних випадках множина точок також може бути дзеркальною. Найбільшого застосування жорстке узгодження множин точок набує у робототехніці та комп'ютерному зорі. Нежорстке перетворенняЗа допомогою нежорсткого узгодження можна отримати нежорстке (нелінійне) узгодження, яке відображає одну множину точок на іншу. Нежорсткі перетворення містять в собі афінні перетворення, такі як масштабування[en] та відображення зсуву. Однак, у контексті узгодження множини точок нежорстке зазвичай включає нелінійне перетворення. Якщо відомі власні вектори множини точок, нелінійне перетворення може бути параметризоване власними значеннями.[7] Нелінійне перетворення також може бути параметризовано за допомогою тонких пластинних сплайнів[en].[1][7] Інші видиДеякі підходи до узгодження множин точок використовують алгоритми, які вирішують більш загальну задачу зіставлення графів[en]. Однак, обчислювальна складність таких методів, як правило, висока, і вони обмежені жорсткими узгодженнями. PCL (Point Cloud Library) — це фреймворк з відкритим вихідним кодом для n-вимірної множини точок і обробки 3D-геометрії, що містить кілька алгоритмів узгодження точок.[8] Узгодження на основі відповідностейМетоди на основі відповідностей припускають, що можливі відповідності задані для кожної точки . Таким чином, отримуємо ситуацію, де обидві множини точок і мають точок, а — це задані відповідності. Узгодження без викидівУ найпростішому випадку можна припустити, що всі відповідності є правильними, тобто точки генеруються наступним чином:
де є сталим коефіцієнтом масштабування [en] обчислень (у багатьох випадках ), є правильною 3D матрицею обертання ( є спеціальною ортогональною групою степеня ), — це вектор паралельного перенесення та моделює невідомий адитивний шум (наприклад, шум Гауса). Зокрема, якщо припустити, що шум має нульове середнє значення та ізотропний гаусівський розподіл зі стандартним відхиленням стандартним відхиленням , тобто , то оптимізація для отримання оцінки максимальної правдоподібності для невідомого масштабу, обертання та перетворення матиме наступний вигляд:
Зауважимо, що коли коефіцієнт масштабування дорівнює 1, а вектор паралельного перенесення дорівнює нулю, то тоді оптимізація відновлює формулювання задачі Вахби[en]. Незважаючи на неопуклість оптимізації (див. 2) через неопуклість множини основоположна робота Бертольда К. П. Хорна показала, що (див. 2) фактично має розв'язок у вигляді замкнутої формули, шляхом розділення оцінки масштабу, повороту та паралельного перенесення.[9] Подібні результати були виявлені Аруном та співавторами.[10] Крім того, щоб знайти унікальне перетворення для кожної множини точок потрібно як мінімум неколінеарні точки. Зовсім нещодавно Бріалес і Гонсалес-Хіменес розробили напіввизначену релаксацію, використовуючи двоїстість Лагранжа, для випадку, коли множина моделей містить різні 3D-примітиви, такі як точки, лінії та площини (в тому випадку, коли модель є 3D-сіткою).[11] Цікаво, що напіввизначена релаксація є емпірично жорсткою, тобто з розв'язку напіввизначеної релаксації можна отримати глобально оптимальний розв'язок. Стійке узгодженняВідомо, що формулювання методу найменших квадратів (див. 2) може працювати з низькою ефективністю за наявності викидів. Відповідність викидів — це пара вимірювань що відхиляється від породжувальної моделі (див. 1). У цьому випадку можна розглянути іншу породжувальну модель таку, як:
де якщо -та пара входить до множини вхідних даних, то вона відповідає моделі без випадкових помилок (див. 1), тобто отримується з шляхом просторового перетворення і додавання невеликого шуму. Однак, якщо -та пара є викидом, то вектор може бути будь-яким довільним вектором . Оскільки заздалегідь невідомо, які відповідності є викидами, стійке узгодження за породжувальною моделлю (див. 3) є надзвичайно важливим для комп'ютерного зору та робототехніки, бо поточні методи зіставлення функцій мають тенденцію виводити сильно спотворені відповідності, де понад відповідностей можуть бути викидами.[12] Далі опишемо кілька поширених парадигм стійкого узгодження. Максимальний консенсусМаксимальний консенсус прагне знайти найбільшу множину відповідностей, яка узгоджуюється з породжувальною моделлю (див. 1) для певного вибору просторового перетворення . Формально, максимальний консенсус вирішує наступну оптимізацію:
де позначає потужність множини . Обмеження у формулі (див. 4) забезпечують те, що кожна пара вимірювань у множині відповідних точок , що задовольняють моделі без викидів, має менший залишок, ніж заданий поріг . На жаль, нещодавні дослідження показали, що глобальне розв'язання проблеми (див. 4) є NP-складною задачею, і глобальні алгоритми, як правило, мають використовувати метод гілок і меж, який має експоненційну складність у найгіршому випадку.[13][14][15][16][17] Хоча розв'язання задачі максимального консенсусу є складним, існують ефективні евристики, які досить добре працюють на практиці. Однією з найпоширеніших евристикою є метод[18] RANSAC. RANSAC — це ітеративний метод гіпотези та перевірки. На кожному кроці ітерації метод спочатку випадково вибирає 3 із загальної кількості відповідності та обчислює гіпотезу з використанням методу Горна[9], потім метод оцінює обмеження в (див. 4), щоб порахувати, скільки відповідностей фактично збігаються з такою гіпотезою (тобто обчислює залишкову величину та порівнює її з порогом для кожної пари вимірювань). Алгоритм завершується або після того, як він знайшов множину консенсусу з достатньою кількістю відповідностей, або після того, як було досягнуто загальної кількості допустимих ітерацій. RANSAC є високоефективний, оскільки основним обчисленням на кожній ітерації є розв'язання задачі за допомогою методу Горна. Однак RANSAC є недетермінованим та працює добре тільки в режимі низького відсотку викидів (наприклад, менше ), оскільки його час роботи зростає експоненційно відносно відсотку викидів.[12] Для заповнення прогалини між швидким, але неточним методом RANSAC та точним, але вичерпним оптимізаційним методом гілок і меж, останні дослідження розробили детерміновані наближені методи вирішення максимізації консенсусу.[13][14][19][15] Видалення викидівМетоди видалення викидів спрямовані на попередню обробку набору сильно пошкоджених відповідностей перед оцінкою просторового перетворення. Метою видалення викидів є зменшення кількості викидів, при цьому зберігаючи внутрішні відповідності, щоб оптимізація через перетворення стала легшою та ефективнішою (наприклад, RANSAC працює погано, коли відношення викидів вище але працює досить добре, коли коефіцієнт викиду нижче ). Парра Бустос та ін. запропонували метод під назвою Гарантоване Видалення Викидів (ГВВ), який використовує геометричні обмеження для скорочення відповідностей викидів, гарантуючи збереження внутрішніх відповідностей.[12] Встановлено, що метод гарантованого видалення викидів здатний різко зменшити коефіцієнт викидів, що може значно підвищити ефективність максимізації консенсусу за допомогою RANSAC або методу гілок і меж. Янг і Карлоун запропонували побудувати попарні інваріантні вимірювання зсуву та обертання (англ. translation-and-rotation-invariant measurements) з вихідного набору вимірювань та вбудувати TRIM як ребра графа, вузлами якого є тривимірні точки. Оскільки внутрішні точки попарно узгоджені з точки зору масштабу, то вони повинні утворювати кліку в межах графа. Таким чином, використовуючи ефективні алгоритми для обчислення максимальної кліки на графі, можна знайти вхідні значення та ефективно виключити викиди.[20] Метод видалення викидів на основі задачі про кліки також виявився досить корисним у проблемах узгодження множин точок у реальному світі. Подібні ідеї видалення викидів також були запропоновані Парра Бустосом та ін.. М-оцінкаM-оцінка замінює метод найменших квадратів у (див. 2) стійкою функцією витрат, яка є менш чутливою до викидів. Формально М-оцінка прагне вирішити наступну проблему:
де представляє вибір стійкої функції витрат. Варто звернути увагу, що вибір відновлює оцінку за методом найменших квадратів у (див. 2). Поширені стійкі функції витрат містять — норми втрат, втрати Губера,[21] втрати Джемана-МакКлюра[22] і втрати за методом найменших квадратів.[23][20] М-оцінка була однією з загальновживаних парадигм стійкої оцінки в робототехніці та комп'ютерному зорі.[24][25] Оскільки стійкі цільові функції зазвичай не є опуклими (наприклад, обрізана відносна квадратична втрата в порівнянні з відносною квадратичною втратою), алгоритми для розв'язання задачі невипуклої оцінки М-шляхом, зазвичай ґрунтуються на локальній оптимізації, де спочатку відбувається початкове припущення, а потім застосовуються ітеративні виправлення перетворення, щоб продовжувати зменшувати значення об'єктивної функції. Локальна оптимізація, як правило, працює добре, коли початкове припущення близьке до глобального мінімуму, але вона також має схильність застрягати в локальних мінімумах, якщо надано погану початкову ініціалізацію. Градуйована неопуклістьГрадуйована неопуклість (англ. Graduated non-convexity) — це структура загального призначення для розв'язання задач невипуклої оптимізації без ініціалізації. Ця структура досягла успіху в додатках раннього зору та машинного навчання.[26][27] Ключова ідея градуйованої неопуклості полягає в тому, щоб вирішити складну неопуклу проблему, починаючи з легкої опуклої задачі. Зокрема, для заданої стійкої функції витрат , можна побудувати допоміжну функцію з гіперпараметром , налаштування якої може поступово збільшувати невипуклість допоміжної функції поки вона не зійдеться до цільової функції .[27][28] Отже, на кожному рівні гіперпараметра , вирішується наступна оптимізація:
Блек і Рангараджан довели, що для цільової функції кожної оптимізації (див. 6) можна створити двоїстість на зважену суму найменших квадратів[en] і так звану функцію процесу викиду на вагових коефіцієнтах, які визначають достовірність оптимізації в кожній парі вимірювань.[29] Використовуючи подвійність Блека-Рангараджана та градуйовану неопуклість, спеціально розроблену для функції Джемана-МакКлюра, Чжоу та ін. розробили швидкий глобальний алгоритм узгодження, який є стійким до приблизно 80 % викидів у відповідностях.[22] Нещодавно Янг на ін. показали, що спільне використання градуйованої неопуклості (призначеної для функції Гемана-МакКлура і усіченої функції найменших квадратів) та двоїстості Блека-Рангараджана може призвести до розв'язку загального призначення для стійких проблем узгодження, включаючи узгодження хмари точок та сітки.[28] Сертифіковано стійке узгодженняМайже жоден із згаданих вище алгоритмів стійкого узгодження (за винятком алгоритму гілок і меж, який у гіршому випадку працює в експоненційному часі) не має гарантій продуктивності, а це означає, що ці алгоритми можуть повертати абсолютно неправильні оцінки без попередження. Тому ці алгоритми не є найдіними для критично важливих застосувань, таких як самокероване водіння. Зовсім нещодавно Янг та співавтори розробили перший алгоритм стійкого узгодження з гарантією надійності, під назвою «Оцінка за методом усічених найменших квадратів і напіввизначеної релаксації» (англ. Truncated least squares Estimation And Semidefinite Relaxation). Для угодження множини точок TEASER не тільки виводить оцінку перетворення, але й кількісно визначає оптимальність даної оцінки. TEASER використовує наступний оцінювач за методом усічених найменших квадратів:
який отримується шляхом вибору усічених найменших квандратів (УНК) надійної функції втрат , де є заздалегідь визначеною константою, яка зумовлює максимально дозволені залишки, які вважаються внутрішніми. Цільова функція УНК має таку властивість, яка визначає, що для внутрішніх відповідностей (), застосовується звичайний метод штрафів найменших квадратів; у той час як для відповідностей викидів () цей штраф не застосовується, а викиди відхиляються. Якщо оптимізація УНК (див. 7) розв'язується з глобальною оптимальністю, то вона еквівалентна методу Хорна лише для внутрішніх відповідностей. Однак, розв'язання (див. 7) є досить складним через його комбінаторний характер. Оцінка за методом усічених найменших квадратів і напіввизначеної релаксації розв'язує (див. 7) наступним чином: (i) Вона створює інваріантні вимірювання таким чином, що оцінка масштабу, обертання та перетворення можуть бути відокремлені та розв'язана окремо. Ця стратегія заснована на оригінальній схемі Горнера. (ii) Та ж оцінка усічених найменших квадратів (далі — УНК) застосовується для кожної з трьох підзадач, де задача УНК масштабу може бути розв'язана за допомогою алгоритму, що називається адаптивним голосуванням. Задача обертання УНК можна послабити до напіввизначеної програми, де релаксація є точною на практиці,[23] навіть із великою кількістю викидів. Задачу зсуву УНК можна вирішити використовуючи покомпонентне адаптивне голосування. Швидке впровадження, що використовує градуйовану неопуклість, має наступний код з відкритим доступом тут. На практиці оцінка за методом усічених квадратів і напіввизначенох релаксації може витримати більше ніж викидів відповідностей і виконуватись за мілісекунди. Крім розробки оцінки за методом усічених квадратів і напіввизначеної релаксації, Янг та співавтори також довели, що за деяких слабких умов на заданій множині точок оцінка перетворення усічених квадратів і напіввизначеної релаксації має певні похибки в порівнянні із справжнім перетворенням.[30] Див. такожПримітки
Посилання |
Portal di Ensiklopedia Dunia