Распознавание животных на аэрофотосъемке




Скачать 56.42 Kb.
Дата 01.10.2016
Размер 56.42 Kb.


Тезисы доклада



  1. НАЗВАНИЕ ДОКЛАДА:

Распознавание животных на аэрофотосъемке

Detection of animals in aerial photography




  1. АВТОРЫ:

Рогов А. А., Талбонен А. Н., Тимонин А. О., Калинин А. В.

Rogov A.A. Talbonen A. N., Timonin A. O., Kalinin A. V.




  1. ОРГАНИЗАЦИЯ:

Петрозаводский государственный университет

Petrozavodsk State University




  1. ГОРОД:

Петрозаводск

Petrozavodsk




  1. ТЕЛЕФОН:

78-51-40, 71-10-40


  1. ФАКС:

71-10-00


  1. E-MAIL:

[email protected], [email protected], [email protected], [email protected]


  1. АННОТАЦИЯ:

В статье описывается проблема автоматической обработки аэрофотоснимков местности и поиска на изображениях целевых объектов фауны. Предлагаемый в данной статье подход обладает достаточной гибкостью для применения к различным группам искомых объектов в различных условиях. Данное исследование имеет большое значение для различных мероприятий в области охраны окружающей среды.
The paper describes the problem of automatic processing of aerial photographs and the problem of finding animals in images. The proposed approach in this paper is flexible and can be applied in different conditions. This research has a great importance for the various activities in the field of environmental protection.


  1. КЛЮЧЕВЫЕ СЛОВА:

Аэрофотосъемка, обработка изображений, поиск объектов на изображениях, распознавание образов

Aerial photography, image processing, search for objects in images, pattern recognition





  1. ТЕКСТ ТЕЗИСОВ ДОКЛАДА:

В настоящее время аэрофотосьемка с помощью беспилотных летательных аппаратов (БПЛА) становится все более и более популярным методом мониторинга местности. В частности, группа исследователей из компании ООО «ФИНКО» г. Ижевска проводит мониторинг численности лосей на территории одного из районов Орловской области в зимний период (см. рис. 1). При этом в результате съемки создается огромная коллекция изображений, в которой доля искомых объектов незначительна. Однако большая часть изображений обрабатывается вручную. В случае очень больших коллекции (несколько тысяч и более) процесс мониторинга становится достаточно трудоемким.

Отметим что, экологический мониторинг актуален и для других видов фауны. В связи с этим наиболее перспективным является метод автоматической (автоматизированной) обработки аэрофотоснимков с использованием универсальных алгоритмов. Это позволит настраивать один и тот же алгоритм под разные целевые объекты (лоси, сайгаки и др.) и условия съемки (заснеженные леса, степи и др.). В данной статье рассматриваются наиболее предпочтительные методы и подходы к решению задачи автоматизации контроля численности целевых объектов.



Рисунок 1. Пример искомых объектов.

В зависимости от разрешения камеры БПЛА средний размер изображений может достигать 4k * 3k пикселей. В таких условиях наиболее предпочтительным являются методы обнаружения, основанные на обработке скользящего окна. Были исследованы следующие алгоритмы:

1. Алгоритм Виолы-Джонса, представляющий собой детектор Хаара, работающий в скользящем окне [1];

2. Распознавание изображения скользящего окна одним из нескольких алгоритмов распознавания:

a. Алгоритм локальных бинарных шаблонов [2];

b. Гистограммы ориентированных градиентов [3];

c. Метод моментов, включая моментные инварианты [4];

d. Использование нейронных сетей

e. Эвристический алгоритм порогового отсечения.

Несмотря на то, что алгоритм Виолы-Джонса обычно применяется для обнаружения людей на изображения, его можно использовать для обнаружения любых объектов. Основной проблемой при использовании этого алгоритма является сложный и затратный процесс обучения: алгоритм требует указать множество релевантных и нерелевантных изображений. С учетом того, что объектами поиска являются объекты специфические и редко встречающиеся, требуется сформировать выборку из исходной коллекции.

В ходе исследований был определен оптимальный подход для формирования первичной обучающей выборки для целевых изображений при отсутствии достаточного количества изображений подобных объектов.

1. Применение эвристических алгоритмов распознавания скользящего окна для обнаружения потенциальных объектов. В результате обработки значительной доли исходных изображений формируется большая коллекция, в которой доля релевантных объектов может не превышать 10%.

2. Использование специального графического интерфейса для ускоренного отбора релевантных объектов. Разработка для этих целей алгоритма распознавания не является оптимальным подходом, т.к. зачастую проще и быстрее просмотреть несколько тысяч небольших объектов и отсеять нерелевантные.

В качестве эвристического алгоритма было использовано пороговое отсечение изображения скользящего окна и вычисления некоторого значения на основе полученных пикселей. В этом случае пороговое значение может задаваться вручную, либо вычисляться как среднее значение фона скользящего окна. Размер окна при этом может превышать размер объекта в 1,5-2 раза. Итоговое значение вычисляется как среднее значение пикселей после применения порогового отсечения, либо как количество оставшихся пикселей.

Для ускоренной сортировки полученных таким образом объектов был разработан специальный пользовательский интерфейс. Основной его особенностью является использование быстрых манипуляций с объектами полученного списка (горячие клавиши, выделение одним кликом) и одновременное выделение сортируемого объекта на том же экране на исходном изображении. Это позволяет сортировать полученные объекты со скоростью 50-100 объектов в минуту [5].

Другим аспектом обучения алгоритма Виолы-Джонса является большое количество требуемых объектов. Требуется минимум ~100 релевантных и ~1000-10000 нерелевантных объектов. В случае, если количество найденных на первом этапе релевантных объектов незначительно, дополнить выборку искусственными объектами, полученными в результате поворота, отражения или незначительного искажения аутентичных релевантных объектов.

Процесс обучения может длиться несколько десятков часов. При этом полученный классификатор можно использовать для повторного обнаружения релевантных объектов с большей полнотой, после чего снова запустить процесс обучения. Данные операции можно повторять до тех пор, пока не будет достигнуты требуемые показатели полноты и точности.

Реализация алгоритма Виолы-Джонса в библиотеке «OpenCV» позволяет запускать полученный классификатор с различными параметрами. При этом параметры по умолчанию обеспечивают поиск с наибольшей полнотой. Однако в данном исследовании требовалось использовать алгоритмы распознавания для сортировки коллекции с наибольшей полнотой. Общая схема сортировки представлена на рисунке ниже (см. рис. 2). Подобный метод был успешно применен для обнаружения и сортировки изображений лиц низкого качества [5, 6].

Рисунок 2. Схема сортировки результатов поиска.


В качестве алгоритмов распознавания предполагается использовать алгоритм локальных бинарных шаблонов и гистограммы ориентированных градиентов [5].

На данный момент теоретические и практические исследования в указанных направлениях продолжаются, однако предложенный подход уже показал свою состоятельность в плане применения полученных методик для обнаружения других групп объектов.



*Работа выполняется при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научно-исследовательской деятельности

Литература

  1. Viola P., Jones M. Robust Real-time Object Detection // Second International Workshop on Statistical and Computational Theories of Vision – Modelling, Learning, Computing and Sampling. – Vancouver, Canada, 2001.

  2. Ahonen T., Hadid A., Pietikäinen M. Face Recognition with Local Binary Patterns // Machine Vision Group, Infotech Oulu.

  3. Dalal N., Triggs B. Histograms of Oriented Gradients for Human Detection. — Режим доступа: http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf

  4. Hu M. K. Visual pattern recognition by moment invariants // IRE Trans. on Information Theory, IT-8. — pp. 179–187. — 1962.

  5. Талбонен А. Н. Математические модели и алгоритмы поиска в электронных коллекциях исторических фотографий // Диссертация на соискание ученой степени кандидата технических наук. ­— Петрозаводск. — 2012 г.

  6. Талбонен А. Н., Рогов А. А. Модели и методы поиска людей на фотографиях из исторического альбома // Ученые записки Петрозаводского государственного университета. Серия «Естественные и технические науки». — 2012. — № 6 (127). — С. 113-117.


База данных защищена авторским правом ©infoeto.ru 2022
обратиться к администрации
Как написать курсовую работу | Как написать хороший реферат
    Главная страница