1. Цели и задачи дисциплины
Цель преподавания дисциплины – показать студентам, как изученные ими ранее математические методы решения абстрактно поставленных задач можно применять для работы с реальными данными (неточными, неполными, противоречивыми и т.д.) в решении реальных нечетко сформулированных производственных задач в рамках методов, предлагаемых теорией распознавания образов.
2. Место дисциплины в структуре ООП
Дисциплина относится к профессиональному циклу. При изучении дисциплины «Распознавание образов» используются знания, полученные студентами в рамках дисциплин «Алгебра и геометрия», «Математический анализ», «Дискретная математика», «Теория вероятностей и математическая статистика», «Методы оптимизации». Знания, полученные в рамах данной дисциплины, могут быть основой для выполнения студентом научно-исследовательской работы и выпускной квалификационной работы.
3. Требования к результатам освоения дисциплины:
Распознавание образов – один из подходов к использованию математического аппарата линейной алгебры, методов оптимизации, теории вероятностей, комбинаторики, теории графов, функционального анализа, алгебры логики в решении реальных прикладных задач поддержки принятия решений. Предмет методов распознавания образов – это процедуры, позволяющие переходить от реальных задач прогнозирования, выбора наилучшего решения, оценки ситуации и т.п. к формальной математической постановке этих задач. В результате изучения дисциплины студент должен приобрести систематизированные знания и практические навыки переформулировки прикладных задач поддержки принятия решений в терминах математических методов и обратной переформулировки полученных формальных решений в терминах прикладных задач.
4. Объем дисциплины и виды учебной работы
Общая трудоемкость дисциплины составляет 9 зачетных единиц.
Вид учебной работы
|
Всего часов
|
Семестр
|
8
|
|
Аудиторные занятия (всего)
|
80
|
80
|
|
В том числе:
|
|
|
|
Лекции
|
24
|
24
|
|
Практические занятия (ПЗ)
|
24
|
24
|
|
Семинары (С)
|
|
|
|
Лабораторные работы (ЛР)
|
32
|
32
|
|
Самостоятельная работа (всего)
|
56
|
56
|
|
В том числе:
|
|
|
|
Курсовой проект (работа)
|
|
|
|
Расчетно-графические работы
|
|
|
|
Контрольные работы (реферат, эссе и др.)
|
|
|
|
Другие виды самостоятельной работы
|
|
|
|
|
|
|
|
Контроль самостоятельной работы
|
|
|
|
Вид промежуточной аттестации (зачет, экзамен)
|
36
|
Экзамен
|
|
Общая трудоемкость час
зач. ед.
|
172
|
172
|
|
4,75
|
4,75
|
|
5. Содержание дисциплины
5.1. Содержание разделов дисциплины
№ п/п
|
Наименование раздела дисциплины
|
Содержание раздела
|
1
|
Задачи обучения по прецедентам
|
-
Основные понятия и постановка задачи распознавания
-
Классическое и информационное моделирование: факторы, затрудняющие построение математических моделей реальных процессов и явлений; этапы построения моделей: формализация знаний и идентификация параметров.
-
Основные понятия: прецеденты, обучающая выборка, алгоритм обучения, обобщающая способность.
-
Простейшая постановка задачи распознавания образов: пространство параметров и пространство поиска, метод обучения, функционал качества
-
Разновидности постановки задач: классификация, кластеризация, регрессия, прогнозирование; гарантированная и вероятностная постановка задачи.
-
Признаковое описание объектов: типы признаков, матрица объект/признак, синтез признаков
-
Примеры прикладных задач распознавания образов
-
Характеристики прикладных задач: система признаков, источники информации для обучающей выборки, алфавит классов.
-
Области приложения методов распознавания: медицинская диагностика, техническая диагностика, управление качеством продукции, геологические приложения, рубрикация информационных потоков, распознавание текста, оценка заемщиков, оценка инвестиционной привлекательности проектов, прогнозирование спроса, прогнозирование финансовых рынков, анализ клиентских сред.
-
Организация решения задачи распознавания образов
-
Оценка качества обучения: функция потерь, функционал качества, минимизация эмпирического риска, контрольная выборка, проблема переобучения, функционал среднего риска, эмпирические оценки риска.
-
Свойства реальных данных: неточные данные, выбросы, неполные данные, противоречивые данные, разнородные данные, структурированные данные; проблема малых и сверхбольших выборок.
-
Этапы решения задачи распознавания: постановка задачи, сбор данных, предобработка, выбор моделей алгоритмов и методов их настройки, оценка качества алгоритмов, опытная эксплуатация, автоматизированное принятие решений.
-
Эвристические принципы обучения по прецедентам
-
Принцип сходства: гипотеза компактности, пример алгоритма (метод ближайшего соседа), выбор метрики.
-
Принцип регуляризации: функционал структурного риска, пример эвристического критерия регуляризации.
-
Принцип разделимости: разделяющая поверхность, персептронный алгоритм, вероятностная интерпретация разделяющей поверхности.
-
Принцип покрытия: эталоны классов, модель голосования, пример алгоритма построения эталонов.
-
Принцип самоорганизации: критерии для выбора структуры и выбора параметров модели.
-
Принцип композиции: механизмы усреднения и специализации, функции компетентности.
-
Источники тестовых данных: эксперименты на реальных данных, регулярные модельные данные, репозитории тестовых задач.
|
2
|
Линейный классификатор и его обобщения
|
-
Линейное решающее правило
-
Определение линейного и аффинного решающего правила: соотношение между линейным и аффинным правилом, их геометрическая интерпретация, линейная и аффинная разделимость множеств, двойственная интерпретация решающего правила в пространстве решений, максимизация зазора.
-
Алгоритмы построения линейного решающего правила: разделение выпуклых оболочек, перцептронный алгоритм для оптимизационного поиска в пространстве состояний, коэффициент обжига; выбор функционала качества; комбинаторные алгоритмы построения решающего правила.
-
Алгоритмические композиции
-
Пространство оценок и корректирующие операции: алгоритмический оператор, корректирующая операция, базовые алгоритмы; основные виды корректирующих операций.
-
Алгоритмы построения композиций: последовательная, параллельная и глобальная оптимизация – сравнение свойств; общая схема последовательной оптимизации; пример алгоритма параллельной оптимизации – бэггинг
-
Нелинейные обобщения линейного классификатора
-
Нелинейное преобразование пространства параметров: альтернативное представление для нелинейного алгоритмического оператора, метод опорных векторов
-
Многослойные нейронные сети: нелинейное решающее правило, его соотношение с искусственным нейроном, многослойная нейронная сеть прямого распространения, другие топологии нейронных сетей.
|
3
|
Вероятностные классификаторы
|
-
Параметрические методы
-
Особенности вероятностной постановки задачи классификации: априорные вероятности классов, функция правдоподобия класса, классификация вероятностных методов по уровню принятых вероятностных допущений.
-
Функционал среднего риска: ошибки 1-го и 2-го рода, алгоритм минимизации среднего риска.
-
Восстановление плотности распределения: метод максимума правдоподобия и результаты его работы в частных случаях, геометрия разделяющих поверхностей для разных вероятностных предположений, возможные причины вырождения ковариационной матрицы
-
Робастные методы оценивания: понятие робастности, алгоритм робастного оценивания плотности распределения, использование параметрических методов для тестирования не вероятностных методов обучения.
-
Смеси распределений
Задача построения смеси, алгоритм максимизации ожиданий.
-
Непараметрические методы
Ядро плотности, часто используемые ядра плотности. Метод потенциальных функций. Критерии для выбора ширины окна.
|
4
|
Методы классификации по структурному описанию
|
-
Логические алгоритмы классификации
Логические закономерности как обучающая информация. Способы бинаризации признаков. Задача разбиения интервала значений признаков на зоны.
-
Решающие списки и деревья
Решающие списки: жадный алгоритм синтеза, разновидности решающих правил в списках. Решающие деревья: алгоритм синтеза, редукция, бустинг над решающими деревьями
|
5
|
Отбор и синтез информативных признаков
|
-
Методы селекции признаков
-
Предобработка вектора признаков.
-
Селекция признаков на основе проверки статистических гипотез: постановка задачи, мера различия плотности признаков.
-
Векторная селекция признаков: дивергенция, матрицы рассеивания, стратегии сокращения и наращивания вектора признаков, алгоритм плавающего поиска.
-
Методы синтеза признаков
-
Однородное преобразование признакового пространства: базисные вектора; преобразование Карунена-Лоэва, дискретное преобразование Фурье, преобразования Адамара и Хаара.
-
Неоднородное преобразование признакового пространства: региональные признаки, признаки для описания текстуры, признаки формы и размера,скелетизация
|
5.2. Матрица соотнесения тем/разделов учебной дисциплины/модуля и формируемых в них профессиональных и общекультурных компетенций.
Темы,
разделы
дисциплины
|
Количество
часов
|
Компетенции
|
ПК2
|
ПК3
|
|
|
|
|
|
|
|
|
|
Σ
общее количество компетенций
|
1
|
38
|
+
|
+
|
|
|
|
|
|
|
|
|
|
2
|
2
|
28
|
+
|
+
|
|
|
|
|
|
|
|
|
|
2
|
3
|
24
|
+
|
+
|
|
|
|
|
|
|
|
|
|
2
|
4
|
22
|
+
|
+
|
|
|
|
|
|
|
|
|
|
2
|
5
|
24
|
+
|
+
|
|
|
|
|
|
|
|
|
|
2
|
5.4. Разделы дисциплин и виды занятий
№ п/п
|
Наименование раздела дисциплины
|
Лекц.
|
Практ.
зан.
|
Лаб.
зан.
|
Семи-нары
|
СРС
|
КСР
|
Все-го
час.
|
Формы текущего контроля
|
1
|
Задачи обучения по прецедентам
|
8
|
6
|
8
|
|
16
|
|
38
|
|
2
|
Линейный классификатор и его обобщения
|
8
|
6
|
8
|
|
10
|
|
28
|
Контр. работа
|
3
|
Вероятностные классификаторы
|
4
|
4
|
6
|
|
10
|
|
24
|
|
4
|
Методы классификации по структурному описанию
|
10
|
4
|
4
|
|
10
|
|
22
|
Контр. работа
|
5
|
Отбор и синтез информативных признаков
|
6
|
|
6
|
|
10
|
|
24
|
|
6. Лекции
№ п/п
|
№ раздела дисциплины
|
Наименование лекционного занятия
|
Трудо-емкость
(час.)
|
1
|
1
|
Основные понятия и постановка задачи распознавания
|
1
|
2
|
1
|
Примеры прикладных задач распознавания образов
|
1
|
3
|
1
|
Организация решения задачи распознавания образов
|
1
|
4
|
1
|
Эвристические принципы обучения по прецедентам
|
3
|
5
|
2
|
Линейное решающее правило
|
2
|
6
|
2
|
Алгоритмические композиции
|
2
|
7
|
2
|
Нелинейные обобщения линейного классификатора
|
2
|
8
|
3
|
Параметрические методы
|
2
|
9
|
3
|
Смеси распределений
|
1
|
10
|
3
|
Непараметрические методы
|
1
|
11
|
4
|
Логические алгоритмы классификации
|
2
|
12
|
4
|
Решающие списки и деревья
|
2
|
13
|
5
|
Методы селекции признаков
|
2
|
14
|
5
|
Методы синтеза признаков
|
2
|
7. Практические занятия (семинары)
№ п/п
|
№ раздела дисциплины
|
Тематика практических занятий (семинаров)
|
Трудо-емкость
(час.)
|
1
|
1
|
Разбор прикладных задач, сводимых к задачам распознавания образов. Формализация основных элементов задачи распознавания: прецедентов, параметров состояния, обучающей выборки, классов
|
8
|
2
|
2
|
Оптимизационный и комбинаторный подходы к построению решающих правил: разбор дополнительных алгоритмов, сравнительный анализ
|
4
|
3
|
3
|
Сравнение вероятностной и геометрической интерпретации задач распознавания
|
4
|
4
|
4
|
Использование механизмов бинаризации признаков различных типов. Конструирование составных предикатов.
|
4
|
5
|
5
|
Применение методов неоднородного преобразования признакового пространства в задачах анализа изображений.
|
4
|
8. Лабораторный практикум
№ п/п
|
№ раздела дисциплины
|
Наименование лабораторных работ
|
Трудо-емкость
(час.)
|
1
|
1
|
Кластеризация по методу ближайшего соседа
Знакомство с возможностями программного пакета MathWorks Matlab в части решения задач распознавания образов.
Генерация модельных данных для задач кластеризации и классификации.
Реализация метода k ближайших соседей и подбор метрики для решения задачи кластеризации на сгенерированных данных.
|
8
|
2
|
2
|
Линейные решающие правила
Реализация перцептронного алгоритма для построения линейного решающего правила. Графическое представление оптимизационного поиска в пространстве параметров состояния и в пространстве поиска. Выбор правила масштабирования шага поиска.
|
4
|
3
|
2
|
Композиция на основе линейных решающих правил
Реализация последовательного алгоритма построения комитета большинства на основе линейных решающих правил. Реализация алгоритма для выбора начального приближения в алгоритме построения композиции.
|
4
|
4
|
3
|
Вероятностный классификатор на основе потенциальных функций
Генерация модельных данных для задачи классификации в вероятностной постановке.
Реализация метода потенциальных функций для нормально распределенных классов. Подбор функции ядра плотности для решения задачи классификации
|
6
|
5
|
4
|
Построение решающих деревьев
Бинаризация параметров объектов.
Реализация жадного алгоритма построения решающего дерева на основе оценок информативности разбиений узла дерева по различным признакам.
|
4
|
6
|
5
|
Селекция признаков на автоассоциативной нейронной сети
Реализация автоассоциативной нейронной сети и алгоритма ее обучения. Преобразование данных обучающей выборки для решения задачи селекции признаков
|
4
|
10. Учебно-методическое и информационное обеспечение дисциплины:
а) основная литература
-
Duda R.O., Hart P.E., Stork D.G. Pattern classification. N.Y.: Wiley Intersciences, 2002. 680 p.
-
Ту Дж., Гонсалес Р. Принципы распознавания образов /Пер. с англ. /Под ред.Ю.И. Журавлева. М.:Мир,1978.
-
Распознавание. Классификация. Прогноз (Серия сборников). Вып. 1–4. М.: Наука, 1989–1994.
-
Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 1989.
б) дополнительная литература
-
Мазуров В.Д. Метод комитетов в задачах оптимизации и классификации. М.: Наука, 1990.
-
Воронцов К.В. Математические методы обучения по прецедентам: Курс лекций. http://www.ccas.ru/voron/download/Introduction.pdf
-
Местецкий Л. М. Математические методы распознавания образов. Курс лекций. www.ccas.ru/frc/papers/mestetskii04course.pdf.
-
Загоруйко, Н.Г. Прикладные методы анализа данных и знаний / Н.Г. Загоруйко. – Новосибирск: ИМ СО РАН, 1999.
в) программное обеспечение
Программный пакет MathWorks Matlab (академическая версия).
г) базы данных, информационно-справочные и поисковые системы
Шаблоны лабораторных работ в виде текста программ на языке Matlab
10. Материально-техническое обеспечение дисциплины
Компьютерный класс для выполнения лабораторных работ.
11. Кадровое обеспечение дисциплины:
Лектор: доц., к.т.н. Кувшинов Б.М.
Резервный лектор: преп. Бородянко О.Н.
12. Методические рекомендации по организации изучения дисциплины:
При изучении дисциплины необходимо показать студентам, что распознавание образов – один из подходов к использованию математического аппарата линейной алгебры, методов оптимизации, теории вероятностей, комбинаторики, теории графов, функционального анализа, алгебры логики в решении реальных прикладных задач поддержки принятия решений. Предмет методов распознавания образов – это процедуры, позволяющие переходить от реальных задач прогнозирования, выбора наилучшего решения, оценки ситуации и т.п. к формальной математической постановке этих задач.
12.1. Применяемые образовательные технологии
– лабораторные работы, включающие согласование с преподавателем постановки задачи, самостоятельную реализацию и тестирование программ, защиту разработанных программ
Удельный вес занятий, проводимых в интерактивных формах в учебном процессе составляют 40% аудиторных занятий. Занятия лекционного типа составляют 30% аудиторных занятий.
12.2. Оценочные средства для текущего контроля успеваемости и промежуточной аттестации по итогам освоения дисциплины и учебно-методическое обеспечение самостоятельной работы студентов
По результатам самостоятельной работы студенты отчитываются о выполнении следующих видов работ:
– самостоятельная проработка алгоритмов, которые на лекциях рассматриваются только до уровня сведения исходной задачи к стандартным задачам линейной алгебры, методов оптимизации, теории вероятностей, комбинаторики, теории графов, функционального анализа, алгебры логики
– изучение по рекомендованной литературе существующих вариаций типовых методов и алгоритмов, которые на аудиторных занятиях рассматриваются только в одной из возможных реализаций
– самостоятельный поиск современных версий алгоритмов, которые в классическом виде имеют ограничения на применимость, обсуждаемые на лекциях
13. Разделы дисциплины, выносимые на итоговую государственную аттестацию (ИГА)
нет
|