Распознавание образов для распознавания изображений

Мне нужно написать программу, которая распознает некоторые закономерности на разных фотографиях. Я написал программу, которая берет фотографию в качестве входных данных и создает другое изображение с краями предыдущей фотографии. Теперь я застрял на обнаружении закономерностей. Я попытался взять 2d массивы пикселей и отметить каждый возможный узор, присвоив каждому пикселю значение от 0 до n (максимальное количество пикселей в последовательности). Затем я беру объекты, которые программе уже известны, и смотрю, какой из них содержит больше найденных шаблонов.

Проблема в том, что помимо эффективности, программа не будет работать, если изображение перевернуто (если я натренирую его с помощью фотографии, а затем переверну фотографию, программа не распознает его).

Можете ли вы рассказать мне о некоторых методах выполнения моей задачи или о каких-нибудь хороших руководствах или курсах, которые объясняют процесс намного глубже, чем просто «поиск закономерностей»?


person Alex    schedule 18.04.2016    source источник


Ответы (1)


Описание вашей проблемы очень общее. Чтобы получить более точные ответы, предоставьте некоторые характеристики входных данных, а также опишите, какие шаблоны вы ищете.

Что может быть полезно в общей проблеме распознавания образов, так это использование нейронных сетей. Например, вы можете проверить первую главу. этой книги http://neuralnetworksanddeeplearning.com/chap1.html

Вот простой пример распознавания образов рукописных цифр. В вашем случае для решения проблемы вращения вам, вероятно, также придется повернуть пример обучения.

person realmaniek    schedule 18.04.2016
comment
Я это уже читал. Это кое-что объяснило, но у меня остались вопросы. По поводу проблем с вращением. Вы говорите, что этого нет, правда? Я думал о чем-то похожем, но подумал, что есть гораздо более умный способ. Алгоритм, который идентифицирует любой паттерн, просто видя его в одной позиции. Я понимаю, что все сводится к какой-то геометрии и грубой силе. - person Alex; 18.04.2016
comment
В зависимости от того, насколько сложны ваши формы, могут быть полезны вещи, называемые «факторами формы». Это не что иное, как формулы, описывающие абстрактную форму вашего объекта. Возможно, подсчет пары различных форм-факторов и ввод их в нейронную сеть поможет. Вы можете начать читать отсюда: en.wikipedia.org/wiki/ Уведомление , что переворачивание фигур не влияет на их значения. - person realmaniek; 18.04.2016