Структура локального детектора модели репринта объекта на изображении

А. А. Куликов

doi:10.32362/2500-316X-2021-9-5-7-13

Структура локального детектора модели репринта объекта на изображении

А. А. Куликов

https://doi.org/10.32362/2500-316X-2021-9-5-7-13

Полный текст:

PDF (Rus) PDF (Eng)

сгенерировать QR код

Аннотация

Задача распознавания объектов на изображениях является актуальной в настоящее время, поскольку существующие системы и методы не решают полностью проблему идентификации в сложных условиях: помехи, освещение, различные изменения на лице и т.д. С целью решения этой задачи разработан и описан локальный детектор для модели репринта объекта на изображении. Для локального детектора разработан трансформирующий автокодер (ТА) – модель нейронной сети. Данная модель является подвидом общего класса нейронных сетей снижения размерности. Локальный детектор способен, помимо определения измененного объекта, также определить и изначальную форму объекта. Особенностью ТА является представление участков изображения в компактном виде и проведение оценки параметров аффинной трансформации. Трансформирующий автокодер представляет собой гетерогенную сеть (ГС), состоящую из множества сетей меньшей размерности, называемых капсулами. Искусственные нейронные сети должны использовать локальные капсулы, которые выполняют некоторые довольно сложные внутренние вычисления на своих входах, а за-тем инкапсулируют результаты этих вычислений в небольшой вектор высокоинформативных выходов. Каждая капсула учится распознавать неявно определенный визуальный объект в ограниченной области условий про-смотра и деформаций. Она выводит как вероятность того, что объект присутствует в своей ограниченной области, так и набор «параметров экземпляра», которые могут включать точную позу, освещение и деформацию визуального объекта относительно неявно определенной канонической версии этого объекта. Главное преимущество капсул, выводящих параметры экземпляра, заключается в простом способе распознавания целых объектов путем распознавания их частей. Капсула может научиться выводить позу своего визуального объекта в вектор, линейно связанный с «естественными» представлениями позы, которые используются в компьютерной графике. Существует простой и высокоселективный тест на то, имеют ли визуальные объекты, представ-ленные двумя активными капсулами, правильные пространственные отношения для активации капсулы более высокого уровня. Трансформирующий автокодер решает проблему идентификации лицевых изображений в условиях помех (шумности), изменения освещенности и ракурса.

Ключевые слова

нейронная сеть, распознавание изображений, распознавание образов, модель идентификации

Об авторе

А. А. Куликов

МИРЭА – Российский технологический университет
Россия

Куликов Александр Анатольевич, к.т.н., доцент, кафедра инструментального и прикладного программного обеспечения Института информационных технологий

119454, Россия, Москва, пр-т Вернадского, д. 78

Список литературы

1. Парфинович С.Н. Алгоритмы распознавания лиц для верификации личности по изображению. В сб.:«Молодой исследователь: вызовы и перспективы»: сб.мат. CXIV Международной научно-практической конференции. М.: Интернаука; 2019. С. 155−163.

2. Ахмедов А.А., Сагидов Г.С., Курбанисмаилов Г.М. Алгоритм распознавания лиц на основе метода Виолы – Джонса. В сб.:«Молодой исследователь: вызовы и перспективы»: сб. мат. CXVIII Международной науч-но-практической конференции. М.: Интернаука; 2019. С. 270−274.

3. Пентланд А., Чаудхари Т. Распознавание лиц для интеллектуальных сред. Открытые системы. 2000;03. URL: https://www.osp.ru/os/2000/03/177939

4. Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания: Некоторые аспекты. М.: Радио и связь; 1985. 161 с.

5. Самаль Д.И., Фролов И.И. Алгоритм подготовки обучающей выборки с использованием 3D-моделиро-вания лиц. Системный анализ и прикладная информатика. 2016;4:17−23. URL: https://sapi.bntu.by/jour/article/view/128/105

6. Завалов Р.А., Гараев Р.А. Реализация алгоритма Виолы – Джонса на микроконтроллере с ограниченными ресурсами. Наука и образование сегодня. 2018;6(29):18−23. URL: https://cyberleninka.ru/article/n/realizatsiya-algoritma-violy-dzhonsa-na-mikrokontrollere-s-ogranichennymi-resursami/viewer

7. Балдин А.В., Елисеев Д.В. Алгебра многомерных матриц для обработки адаптируемой модели данных. Наука и образование: научное издание МГТУ им. Н.Э. Баумана. 2011;7:4. URL: http://technomag.edu.ru/doc/199561.html

8. Korotkov A. Database index for approximate string matching. In: Proceedings of the 4th Spring/Summer Young Researchers’ Colloquium on Software Engineering. SYRCoSE ’10. 2010, p. 136−140. https://doi.org/10.15514/syrcose-2010-4-27

9. Кононыхин И.А., Ежов Ф.В., Мартынюк Р.А. и др. Реализация системы распознавания и отслеживания лиц. Молодой ученый. 2020;28(318):8−12. URL: https://moluch.ru/archive/318/72492/

10. Hinton G.E., Krizhevsky A., Wang S.D. Transforming auto-encoders. In: Honkela T., Duch W., Girolami M., Kaski S. (Eds.). Artificial Neural Networks and Machine Learning – ICANN 2011. ICANN 2011. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg; 2011. V. 6791. P. 44−51. https://doi.org/10.1007/978-3-642-21735-7_6

11. Alghaili M., Li Z., Ali H.A.R. FaceFilter: Face identification with deep learning and filter algorithm. Scientific Programming. 2020:1−9. https://doi.org/10.1155/2020/7846264

12. Fitzgerald R.J., Price H.L., Valentine T. Eyewitness identification: Live, photo, and video lineups. Psychology, Public Policy, and Law. 2018;24(3):307−325. http://dx.doi.org/10.1037/law0000164

13. Etemad K., Chellapa R. Discriminant Analysis for Recognition of Human Face Images. Journal of the Optical Society of America A. 2004;14(8):1724−1733. https://doi.org/10.1364/JOSAA.14.001724

14. Куликов А.А. Модель репринта объекта на изображении. Российский технологический журнал. 2020;8(3):7−13. https://doi.org/10.32362/2500-316X-2020-8-3-7-13

15. Романенко А.О., Юфряков А.В. Оценка размытия изображения для биометрической идентификации. Наука и образование сегодня. 2018;7(30):16−19. URL: https://cyberleninka.ru/article/n/otsenka-razmytiya-izobrazheniya-dlya-biometricheskoy-identifikatsii/viewer

Дополнительные файлы

	1. Три капсулы трансформирующего автоэнкодера
	Тема
	Тип	Исследовательские инструменты
	Посмотреть (139KB)	Метаданные ▾

С целью решения задачи распознавания объектов на изображениях разработан и описан локальный детектор для модели репринта объекта на изображении. Для локального детектора разработан трансформирующий автокодер – модель нейронной сети. Локальный детектор способен, помимо определения измененного объекта, также определить и изначальную форму объекта. Трансформирующий автокодер представляет собой гетерогенную сеть, состоящую из множества сетей меньшей размерности, называемых капсулами. Капсула может научиться выводить позу своего визуального объекта в вектор. Трансформирующий автокодер решает проблему идентификации лицевых изображений в условиях помех (шумности), изменения освещенности и ракурса.

Рецензия

Для цитирования:

Куликов А.А. Структура локального детектора модели репринта объекта на изображении. Russian Technological Journal. 2021;9(5):7-13. https://doi.org/10.32362/2500-316X-2021-9-5-7-13

For citation:

Kulikov A.A. The structure of the local detector of the reprint model of the object in the image. Russian Technological Journal. 2021;9(5):7-13. https://doi.org/10.32362/2500-316X-2021-9-5-7-13

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2782-3210 (Print)
ISSN 2500-316X (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

	Заголовок	Три капсулы трансформирующего автоэнкодера
	Тип	Исследовательские инструменты
	Дата	2021-11-19

Войти

Russian Technological Journal

Структура локального детектора модели репринта объекта на изображении

Полный текст:

Аннотация

Ключевые слова

Об авторе

Список литературы

Дополнительные файлы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов