Масштабопросторове сегментування![]() ![]() Масштабопросторо́ве сегментува́ння (англ. scale-space segmentation) або багатомасшта́бне сегментува́ння (англ. multi-scale segmentation) — це загальна система для сегментування сигналів та зображень, яка ґрунтується на обчисленні описувачів зображення в кількох масштабах згладжування. Одновимірне ієрархічне сегментування сигналуЗасаднича робота Віткіна в просторах масштабів[1][2] містила ідею про те, що одновимірний сигнал можливо однозначно сегментувати на області, з одним параметром масштабу для контролю масштабу сегментування. Ключове спостереження полягає в тому, що перетини нуля другими похідними (мінімуми та максимуми першої похідної, або нахилу) багатомасштабно згладжених версій сигналу утворюють дерево вкладеності, яке визначає ієрархічні відносини між сегментами в різних масштабах. Зокрема, екстремуми нахилу в грубих масштабах можливо простежувати до відповідних ознак у тонких масштабах. Коли максимум нахилу та мінімум нахилу знищують один одного на більшому масштабі, три розділені ними сегменти зливаються в один сегмент, відтак визначаючи ієрархію сегментів. Сегментування зображень та первинний ескізУ цій галузі було багато дослідницьких праць, деякі з яких досягли такого стану, коли їх можливо застосовувати або за допомогою інтерактивного ручного втручання (зазвичай із застосуванням до медичного унаочнювання), або повністю автоматично. Нижче наведено короткий огляд деяких основних дослідницьких ідей, на яких ґрунтуються сучасні підходи. Втім, структура вкладеності, описана Віткіним, специфічна для одновимірних сигналів, і не передається тривіально на зображення більшої вимірності. Менше з тим, ця загальна ідея надихнула декількох інших авторів дослідити грубо—тонкі схеми для сегментування зображень. Коендерінк[3] запропонував досліджувати, як контури ізояскравості змінюються з масштабом, і цей підхід було досліджено докладніше Ліфшицем і Пайзером.[4] Проте, на жаль, яскравість ознак зображень змінюється з масштабом, що означає, що важко відстежити ознаки зображення грубого масштабу до тонших масштабів, використовуючи інформацію про ізояскравість. Ліндеберг[5] досліджував задачу зв'язування локальних екстремумів та сідлових точок над масштабами, й запропонував подання зображення, назване масштабопросторовим первинним ескізом (англ. scale-space primal sketch), яке робить явними відношення між структурами в різних масштабах, а також уточнює, які ознаки зображення є стабільними протягом великих діапазонів масштабів, включно з локально відповідними масштабами для них. Берґгольм[6] запропонував виявляти контури на грубих масштабах простору масштабів, а потім простежувати їх до тонших масштабів з ручним вибором як масштабу грубого виявляння, так і масштабу тонкого визначення розташування. Ґаух та Пайзер[7] досліджували доповняльну задачу хребтів та долин у багатьох масштабах, і розробили інструмент для інтерактивного сегментування зображень на основі багатомасштабних вододілів[en] (англ. multi-scale watersheds). Використання багатомасштабного вододілу із застосуванням до градієнтної карти також було досліджено Олсеном та Нільсеном,[8] і було перенесено до клінічного використання Демом зі співавт.[9] Вінкен зі співавт.[10] запропонували гіперстек для визначення ймовірнісних зв'язків між структурами зображень у різних масштабах. Ахуджа та його співробітники[11][12] розширили використання стабільних структур зображень над масштабами до повністю автоматизованої системи. Повністю автоматичний алгоритм сегментування мозку, заснований на тісно пов'язаних ідеях багатомасштабних вододілів, було запропоновано Ундеманом та Ліндебергом,[13] і було ретельно перевірено на базах даних мозку. Ці ідеї для багатомасштабного сегментування зображень шляхом зв’язування структур зображення над масштабами також підхопили Флорак і Куйпер.[14] Біжауї та Руе[15] пов'язують структури, виявлені в просторі масштабів вище мінімального шумового порогу, в дерево об'єктів, яке охоплює декілька масштабів і відповідає свого роду ознаці у первинному сигналі. Виділені ознаки точно відновлюються за допомогою ітераційного методу матриці спряжених градієнтів. Сегментування векторних функцій часуМасштабопросторове сегментування було розширено Ліоном[16] в іншому напрямку, до векторозначних функцій часу, де векторна похідна не має максимумів та мінімумів, а друга похідна не має перетинів нуля, шляхом розміщення меж сегментів натомість на максимумах евклідової величини векторної похідної згладжених векторних сигналів. Цю методику було застосовано для сегментування мовлення та тексту.[17] Примітки
Див. також |
Portal di Ensiklopedia Dunia