Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа (11.01.2010)

Автор: Хафизов Ринат Гафиятуллович

2) формирование адекватных моделей изображений плоских и объемных изображений на основе контурного и кватернионного анализа;

3) разработка аналитического представления формы плоских и объемных изображений на основе контурного и кватернионного анализа;

4) разработка методов фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений;

5) разработка методов обработки и распознавания, расположенных на плоскости и в 3D пространстве изображений по их форме;

6) реализация разработанных методов обработки и распознавания 2D и 3D изображений по их форме и оценка их эффективности.

Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, контурного и кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.

Научная новизна определяется результатами, полученными в диссертации впервые, и заключается в следующем:

1. Разработаны методы распознавания двумерных и трехмерных изображений по их форме, инвариантные к преобразованиям переноса, масштабирования и вращения этих изображений.

2. Исследованы методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений. Получены аналитические соотношения для согласованной фильтрации поливекторных сигналов и выяснены механизмы работы таких фильтров. Обнаружен эффект расщепления кватернионным фильтром гармоник спектра фильтруемого сигнала.

3. Разработан метод обработки изображений на основе согласованно-избирательной фильтрации для решения задачи обнаружения изображений объектов на сложном многоградационном и статистически неоднородном фоне.

4. Разработан на базе анализа векторных полей метод детектирования формы участков 3D поверхности.

Практическая значимость работы.

1. Полученные методы распознавания изображений по их форме, задаваемой контуром в комплекснозначном (для 2D изображений) или в кватернионном (для 3D изображений) виде, применены для решения задач распознавания плоских и объемных изображений биомедицинских объектов при создании информационных автоматизированных систем поддержки хирурга.

2. Разработанный метод согласованно-избирательной фильтрации изображений позволил решить задачу обнаружения изображений объектов на сложным нестационарном фоне в ландшафтных сценах и в сценах с изображениями медико-биологических объектов.

3. На базе фильтров, согласованных с комплекснозначными и кватернионными сигналами, решены инвариантно к преобразованиям переноса, масштабирования, вращения и сдвига начальной точки задачи распознавания плоских и объемных изображений по их форме.

4. Разработанный метод детектирования формы участков 3D поверхности использован для решения задач визуализации пространственных изображений.

Реализация результатов работы. Теоретические и практические результаты диссертационной работы использованы в НИР «Притирка-1К» и «Эксперт» при разработке распределенных информационных систем специального назначения ФГУП «Курский НИИ» МО РФ, а также при проведении НИР № 200/01709 («Статуэтка-УПКБ») в ОАО «УПКБ «Деталь». Результаты диссертационной работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по грантам РФФИ (№№ 97-01-00906, 99-01-00186, 01-01-14029, 01-01-00298, 03-01-14065д, 04-01-00243, 05-01-96510 р_поволжье_а), Министерства общего и профессионального образования РФ (1997-1998 гг.), Миннауки и технологий (№0201.05.021, 1998г.), Минобразования РФ (№03.01.06.001, 2000г.), а также в НИР, выполняемых автором в качестве руководителя по г/б НИР в рамках Государственного контракта от «28» февраля 2006 г. №02.442.11.7328 ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы» «Единая теория обработки изображений групповых точечных объектов» (шифр 2006-РИ-19.0/001/348), а также по гранту РФФИ «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен», проект 08-01-12000-офи. Результаты диссертационной работы внедрены в учебный процесс по направлениям подготовки «Радиотехника» и «Биомедицинская инженерия».

Апробация работы. Результаты работы обсуждались на международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (Нижний Новгород, 1997; Великий Новгород, 2002; Санкт-Петербург, 2004; Йошкар-Ола, 2007; Нижний Новгород, 2008); на Всероссийской конференции «Математические методы распознавания образов» (Москва, 2003, 2005, 2009); на Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве» (Нижний Новгород, 1999); на международной конференции «Распознавание» (Курск, 2001, 2005, 2008); на международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В.А. Котельникова» (Москва, 2003); на региональной научно-технической конференции (Казань, 2004); на международной научно-практической конференции «Авиакосмические технологии и оборудование» (Казань, 2006); на ежегодных научных конференциях по итогам НИР МарГТУ и научных семинарах кафедры радиотехнических и медико-биологических систем и др.

Публикации. Всего по теме диссертации опубликовано 67 работ: из них 2 монографии (издательство «Физматлит», Москва); 14 –в центральных научных журналах из Перечня ВАК; 26 – материалы конференций;

18 – в других научных изданиях и депонированные в ВИНИТИ; 6 – свидетельств об официальной регистрации программ в Роспатент.

Структура и объем работы. Диссертация состоит из введения, 6 глав, заключения и содержит 140 рисунков, 8 таблиц. Список литературы включает 179 наименований. Основная часть работы изложена на 322 стра-ницах.

На защиту выносятся.

1. Метод аналитического представления формы плоских и объемных изображений, обладающего метрическими свойствами и содержащим необходимую для их распознавания информацию.

2. Методы распознавания плоских и объемных изображений по их форме, обеспечивающие инвариантность к преобразованиям переноса, масштабирования и вращения этих изображений.

3. Методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений, обеспечивающие формирование достаточной статистики для принятия решения при распознавании изображений по их форме.

4. Метод обработки изображений на основе согласованно-избирательной фильтрации, обеспечивающий обнаружение изображений объектов на сложном многоградационном и статистически неоднородном фоне.

5. Метод детектирования формы 3D изображений поверхности на базе принципа обработки множества ближайших точек генерального точечного поля и анализа векторных полей.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, сформулирована цель, направление исследований и основные научные положения, показана научная новизна и практическая значимость полученных результатов.

В первой главе исследовано современное состояние и проблемы теории обработки и распознавания изображений. Показано, что эти проблемы обусловлены действием следующих факторов: низкое отношение сигнал/шум; высокая степень детальности изображений объектов в анализируемой сцене; необходимость получения результатов распознавания в реальном или близком к нему масштабов времени; сильная статистическая неоднородность многоградационных по яркости фонов и изображений объектов; неинвариантность применяемых алгоритмов к линейным преобразованиям изображений, в первую очередь, к их повороту; несовершенство теоретических подходов к обработке и распознаванию изображений, особенно в 3D сценах, вызванных использованием эвристических подходов.

, заданных в бесконечномерном пространстве. Отсюда следует, что для обработки сигналов с одинаковым конечным результатом, (естественно, с разными затратами и ресурсами) можно применять методы математического анализа, дискретной математики и геометрии.

Сформулирована следующая научная концепция диссертационного исследования: использование упрощенных моделей изображений объектов, не связанных со значительной потерей содержащейся в изображении информации, позволяющих исключить эвристические подходы и использовать для распознавания изображений аппарат теории обработки сигналов. Подход, основанный на этой концепции, заключается в отказе от обработки каждого элемента изображения и переходе к обработке лишь его контуров, концентрирующих содержащую в изображении информацию.

Во второй главе в качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, в которых определены основные арифметических действия – сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство R, линейное комплексное пространство C и псевдолинейные кватернионное H и октавное O пространства. В пространстве R возможно представление и обработка как плоских, так и пространственных (трехмерных) изображений, в пространстве C – только плоских изображений. Псевдолинейность пространства H обусловлена некоммутативными свойствами операции умножения; в нем возможно представление и обработка трехмерных и четырехмерных изображений.

, то ЭВ содержат в качестве своих компонент вещественные числа, равные длинам проекций точек подмножеств на оси системы от-счета:

Векторные сигналы, представленные в пространствах R,C и H, содержат в качестве своих компонент соответственно двумерные или трехмерные декартовые координаты точек, комплексные числа и кватернионы. Каждая из таких компонент может рассматриваться в качестве вектора. Для подчеркивания этой особенности в ряде случаев векторные сигналы будем называть поливекторными. С целью обоснованного выбора пространства для представления сигналов при решении задачи распознавания изображений исследованы информативные свойства скалярного произведения поливекторных сигналов и их моновекторов в пространстве R,C и H.

скалярное произведение не может быть использовано в качестве меры схожести плоских изображений для их распознавания. Показано, что при проведении дополнительных вычислений, связанных с поворотом изображения, решением системы линейных уравнений и рядом тригонометрических вычислений возможно получение инвариантной к повороту меры схожести. Однако при определении обратных тригонометрических функций, появляются неоднозначные значения этой меры. Для трехмерных изображений, представленных в R, получение такой инвариантной меры возможно лишь в частных случаях, например, когда изображения расположены в одной гиперплоскости.

, содержит дополнительную информацию о векторных сигналах. Она позволяет однозначно определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве R, найти инвариантное к вращению изображений значение меры их схожести.

Поскольку процесс линейной фильтрации сигналов связан с последовательным вычислением значений скалярного произведения фильтруемого сигналом с сигналом в виде импульсной характеристики фильтра, то приведенные выше свойства скалярного произведения в пространстве С позволяют получить инвариантные к вращению фильтруемого сигнала результаты фильтрации. Отмечено, что платой за обеспечение подобной инвариантности является ухудшение примерно в два раза отношения сигнал/шум, вызванное необходимостью учитывать влияние шума как по косинусному, так и по синусному каналам.

Получено аналитическое выражение для скалярного произведения векторных сигналов с трехмерными моновекторами в кватернионном пространстве H и исследованы его информативные свойства. Показано, что скалярное произведение таких сигналов в пространстве R является его составной частью, а дополнительная гиперкомплексная часть обеспечивает более высокую информативность меры схожести объемных изображений.

, являются его моновекторами (элементарными векторами ).


загрузка...