Цю статтю написано занадто професійним стилем зі специфічною термінологією, що може бути незрозумілим для більшості читачів. Ви можете допомогти вдосконалити цю статтю, зробивши її зрозумілою для неспеціалістів без втрат змісту. Можливо, сторінка обговорення містить зауваження щодо потрібних змін.(травень 2022)
Для функції N змінних її хребти — це множина кривих, чиї точки є локальними максимумами в N − 1 вимірах. У цьому відношенні поняття точок хребта розширює поняття локального максимуму. Відповідно, поняття доли́н (англ.valleys) для функції можна визначити, замінивши умову локального максимуму умовою локального мінімуму. Об'єднання множин хребтів і множин долин, разом із пов'язаною множиною точок, званою множино́ю сполу́чників (англ.connector set), утворюють зв'язну множину кривих, які розбиваються, перетинаються або зустрічаються в критичних точках функції. Це спільне об'єднання множин називають відносною крити́чною множино́ю (англ.relative critical set) функції.[1][2]
Множини хребтів, множини долин і відносні критичні множини подають важливу геометричну інформацію, притаманну функції. Певним чином вони забезпечують компактне подання важливих ознак функції, але питання про те, наскільки їх можливо використовувати, щоби визначати глобальні ознаки функції, залишається відкритим. Основна мотивація для створення процедур виявля́ння хребті́в і виявля́ння доли́н походить з аналізу зображень[en] та комп'ютерного бачення, і полягає у вловлюванні внутрішностей видовжених об'єктів в області зображення. Пов'язані з хребтами подання в термінах вододілів[en] використовували для сегментування зображень. Були також спроби вловлювати форми об'єктів за допомогою графових подань, що відображують хребти, долини та критичні точки в області зображення. Проте такі уявлення можуть бути дуже чутливими до шуму, якщо обчислюються лише в одному масштабі. Оскільки обчислення теорії простору масштабів залучають згортку гауссовим (згладжувальним) ядром, сподівалися, що використання багатомасштабових хребтів, долин та критичних точок у контексті теорії простору масштабів дозволить забезпечувати надійніше подання об'єктів (або форм) у зображенні.
масштабопросторового подання з перетворенням координат (повертанням), застосованим до операторів локальних напрямних похідних,
де p та q — координати повернутої системи координат.
Можливо показати, що змішана похідна у перетвореній системі координат нульова, якщо ми оберемо
, .
Тоді формальне диференціальногеометричне визначення хребтів у фіксованому масштабі може бути виражено як набір точок, які задовольняють[3]
Відповідно, долини в масштабі — множина точок
В системі координат з напрямком , паралельним градієнтові зображення,
де
можливо показати, що це визначення хребтів і долин можливо натомість еквівалентно[4] записати як
де
а знак визначає полярність; для хребтів і для долин.
Розрахунок хребтів змінного масштабу з двовимірних зображень
Основна проблема поданого вище визначення хребта фіксованого масштабу полягає в тому, що воно може бути дуже чутливим до вибору рівня масштабу. Експерименти показують, що параметр масштабу гауссового ядра попереднього згладжування мусить бути ретельно підлаштовано до ширини хребтової структури в області зображення, щоби виявляч хребтів створював зв'язану криву, яка відображувала би структури в основі зображення. Для розв'язання цієї проблеми за відсутності попередньої інформації було введено поняття масштабопросторових хребтів (англ.scale-space ridges), яке розглядає параметр масштабу як невід'ємну властивість визначення хребта й дозволяє рівням масштабу змінюватися вздовж масштабопросторового хребта. Більше того, концепція масштабопросторового хребта також дозволяє підлаштовувати параметр масштабу до ширини хребтових структур в області зображення автоматично, фактично як наслідок добре сформульованого визначення. У літературі на основі цієї ідеї було запропоновано низку різних підходів.
Нехай позначує міру вираженості хребта (яку буде вказано нижче). Тоді для двовимірного зображення масштабопросторовий гребінь — це множина точок, які задовольняють
де — параметр масштабу в масштабопросторовому поданні. Аналогічно, масштабопросторовадолина (англ.scale-space valley) — це множина точок, які задовольняють
Безпосереднім наслідком цього визначення є те, що для двовимірного зображення концепція масштабопросторових хребтів вимітає множину одновимірних кривих у тривимірному просторі масштабів, де параметрові масштабу дозволено змінюватися вздовж масштабопросторового хребта (чи масштабопросторової долини). Описувачем хребта в області зображення тоді буде проєкція цієї тривимірної кривої на двовимірну площину зображення, де інформацію про властивий масштаб у кожній точці хребта можливо використовувати як природну оцінку ширини хребтової структури в області зображення в околі цієї точки.
У літературі пропонують різні міри хребтової вираженості. Коли Ліндеберг (1996, 1998)[5] запровадив термін «масштабопросторовий хребет», він розглядав три міри хребтової вираженості:
Основна головна кривина
виражена в термінах -нормованих похідних через
.
Квадрат різниці квадратів -нормованих власних значень
Квадрат різниці -нормованих власних значень
Поняття -нормованих похідних тут важливе, оскільки дозволяє алгоритмам виявляння хребтів і долин належно калібруватися. З вимоги, щоби для одновимірного гауссового хребта, вкладеного в два (або три) виміри, масштаб виявляння дорівнював ширині хребтової структури при вимірюванні в одиницях довжини (вимога відповідності між розмірами фільтра виявляння та структурою зображення, на яку він реагує), випливає, що слід обирати . З цих трьох мір вираженості хребта перша сутність є мірою вираженості хребта загального призначення з багатьма застосуваннями, такими як виявляння кровоносних судин і виділяння доріг. Проте сутність використовували в таких застосуваннях як покращення відбитків пальців,[6]відстежування рук[en] та розпізнавання жестів[en] у реальному часі,[7] а також для моделювання локальних статистик зображень для виявляння та відстежування людей у зображеннях та відео.[8]
Існують також й інші тісно пов'язані визначення хребта, які використовують нормовані похідні з неявним припущенням .[9]Проробити ці підходи докладніше. Проте при виявлянні хребтів з масштаб виявляння буде вдвічі більшим, аніж для , що призводить до більших викривлень форми та нижчої здатності вловлювати хребти та долини з сусідніми завадними структурами зображення в його області.
Історія
Поняття хребтів і долин у цифрових зображеннях було запроваджено Гараліком[en] 1983 року[10] та Кроулі стосовно пірамідрізниць гауссіанів 1984 року.[11][12] Застосування хребтових описувачів до аналізу медичних зображень було детально досліджено Пайзером та його співробітниками,[13][14][15] давши їхнє поняття M-подань (англ.M-reps).[16] Ліндеберг також посприяв розвитку виявляння хребтів, запровадивши -нормовані похідні та масштабопросторові хребти, визначені з локальної максимізації належним чином нормованої головної кривини матриці Гессе (або інших мір вираженості хребта) над простором та над масштабом. Ці поняття пізніше було розвинуто із застосуванням до виділяння доріг Стегером та ін.[17][18] та до сегментування кровоносних судин за Франджі та ін.,[19] а також для виявлення криволінійних і трубчастих структур Сато та ін.[20] та Крисяном та ін.[21] Огляд кількох класичних визначень хребтів у фіксованому масштабі, включно з відношеннями між ними, було запропоновано Кендерінком та ван Дорном.[22] Огляд методів виділяння судин було запропоновано Кірбасом та Квеком.[23]
Визначення хребтів і долин у N вимірах
У своєму найширшому сенсі поняття хребта узагальнює уявлення про локальний максимум дійсної функції. Точка в області визначення функції є локальним максимумом цієї функції, якщо існує відстань , така, що якщо знаходиться всередині одиниць від , то . Добре відомо, що критичні точки, для яких локальні максимуми є лише одним з їхніх типів, це ізольовані точки в області визначення функції у всіх ситуаціях, окрім найнезвичніших (тобто незагальних випадків).
Розгляньмо деяке послаблення умови для у всьому околі до вимоги лише того, щоби вона дотримувалася в -вимірній підмножині. Імовірно, це послаблення дозволяє множині точок, що задовольняють цей критерій, які ми назвемо хребтом, мати один ступінь свободи, принаймні в загальному випадку. Це означає, що множина точок хребта утворюватиме одновимірне геометричне місце точок, або криву хребта (англ.ridge curve). Зверніть увагу, що вищезазначене можливо видозмінити, узагальнивши це уявлення до локальних мінімумів й отримавши те, що можна було би назвати одновимірними кривими долин.
Наступне визначення хребта відповідає книзі Еберлі,[24] й його можливо розглядати як узагальнення деяких із вищезгаданих. Нехай — відкрита множина, а гладенька. Нехай . Нехай — градієнт в , і нехай — матриця Гессе функції в . Нехай — це впорядкованих власних значень , і нехай — одиничний власний вектор у власному просторі для . (Для цього слід виходити з відмінності всі власних значень.)
Точка є точкою на 1-вимірному хребті , якщо виконуються такі умови:
, і
для .
Це уточнює поняття, що , обмежена цим конкретним-вимірним підпростором, має локальний максимум в .
Це визначення природно узагальнюється на k -вимірний хребет наступним чином: точка є точкою на k-вимірному хребті , якщо виконуються наступні умови:
, і
для .
Багато в чому ці визначення природно узагальнюють визначення локального максимуму функції. Властивості гребнів максимальної опуклості (англ.maximal convexity ridges) покладено на тверду математичну основу Деймоном[1] та Міллером.[2] Їхні властивості в однопараметрових сімействах було визначено Келлером.[25]
Максимальномасштабовий хребет
Наступне визначення можливо простежити до Фріча,[26] який цікавився виділянням геометричної інформації про фігури у двовимірних зображеннях у відтінках сірого. Фріч обробляв своє зображення фільтром «серединності» (англ."medialness"), який давав йому інформацію, аналогічну даним «віддаленості від меж» (англ."distant to the boundary") у просторі масштабів. Хребти цього зображення, проєктовані на первинне зображення, мали бути аналогічними кістякові форми (наприклад, блюмовій серединній осі) первинного зображення.
Далі наведено визначення максимальномасштабового хребта (англ.maximal scale ridge) функції трьох змінних, однією з яких є параметр «масштаб». Одне, чого ми хочемо дотриматися в цьому визначенні, це якщо — точка на цьому хребті, то значення цієї функції в ній максимальне за виміром масштабу. Нехай — гладенька диференційована функція . — точка на максимальномасштабовому хребті тоді й лише тоді, коли
і , і
і .
Взаємозв'язок між виявлянням контурів та виявлянням хребтів
Метою виявляння хребтів зазвичай є вловлювання головної осі симетрії видовженого об'єкта,[джерело?] тоді як мета виявляння контурів зазвичай полягає у вловлюванні межі об'єкта. Проте деяка література з виявляння контурів помилково[джерело?] відносить поняття хребтів до поняття контурів, що заплутує ситуацію.
З точки зору визначень, між виявлячами контурів та виявлячами хребтів існує тісний зв'язок. З формулюванням не-максимуму, наведеним Кенні,[27] стверджується, що контури визначаються як точки, де величина градієнта набуває локального максимуму в напрямі градієнта. Дотримуючись диференціальногеометричного способу вираження цього визначення,[28] ми можемо у вищезгаданій системі координат стверджувати, що величина градієнта масштабопросторового подання, яка дорівнює похідній за напрямом першого порядку в напрямі , , повинна мати свою напрямну похідну першого порядку в напрямі рівною нулеві
тоді як напрямна похідна другого порядку в напрямі має бути від'ємною, тобто
.
Записане як явний вираз у термінах локальних частинних похідних , … , це визначення контуру можливо виразити у вигляді кривих, які перетинають нуль, диференціального інваріанта
що задовольняють знакові умові на наступному диференціальному інваріанті
(додаткову інформацію див. у статті про виявляння контурів). Примітно, що отримані таким чином контури є хребтами величини градієнта.
↑ абDamon, J. (March 1999). Properties of Ridges and Cores in Two-Dimensional Images. J Math Imaging Vis. 10 (2): 163—174. doi:10.1023/A:1008379107611. (англ.)
↑ абMiller, J. Relative Critical Sets in and Applications to Image Analysis. Ph.D. Dissertation. University of North Carolina. 1998. (англ.)
↑Haralick, R. (April 1983). Ridges and Valleys on Digital Images. Computer Vision, Graphics, and Image Processing. 22 (10): 28—38. doi:10.1016/0734-189X(83)90094-4. (англ.)
↑Gauch, J.M., Pizer, S.M. (June 1993). Multiresolution Analysis of Ridges and Valleys in Grey-Scale Images. IEEE Trans Pattern Anal Mach Intell. 15 (6): 635—646. doi:10.1109/34.216734. (англ.)
↑Eberly D.; Gardner R.; Morse B.; Pizer S.; Scharlach C. (December 1994). Ridges for image analysis. Journal of Mathematical Imaging and Vision. 4 (4): 353—373. doi:10.1007/BF01262402. (англ.)
↑Pizer, Stephen M., Eberly, David, Fritsch, Daniel S. (January 1998). Zoom-invariant vision of figural shape: the mathematics of cores. Computer Vision and Image Understanding. 69 (1): 55—71. CiteSeerX10.1.1.38.3116. doi:10.1006/cviu.1997.0563. (англ.)
↑Frangi AF, Niessen WJ, Hoogeveen RM, van Walsum T, Viergever MA (October 1999). Model-based quantitation of 3-D magnetic resonance angiographic images. IEEE Trans Med Imaging. 18 (10): 946—56. CiteSeerX10.1.1.502.5994. doi:10.1109/42.811279. PMID10628954. (англ.)
↑Fritsch, DS, Eberly,D., Pizer, SM, and McAuliffe, MJ. "Stimulated cores and their applications in medical imaging." Information Processing in Medical Imaging, Y. Bizais, C Barillot, R DiPaola, eds., Kluwer Series in Computational Imaging and Vision, pp. 365–368. (англ.)