Добрый день, Уважаемые математики!
Нужна консультация, возможно платная, по реализации алгоритма поиска дубликата в базе данных изображений.
Задача:
Поиск дубликата по базе данных изображений.
Подробное описание:
Берем фоторгафию. Уменьшаем (или увеличиваем) разрешение. Накладываем какую-нибудь эмблему.
В итоге имеем два абсолютно разных файла - но визуально человек видит что это одна и та же фотография.
В базе хранится 300 000 изображений. Задача сводится к поиску таких дубликатов.
Эта задача успешно решается с помощью разложения каждого изображения на т.н. вейвлет-коэффициенты.
И алгоритм пошагово описан в книге "Вейвлеты в компьютерной графике". Суть алгоритма:
1. Каждое изображение разлагаем на вейвлет коэффициенты.
2. Квантуем эти коэффициенты, записываем в базу данных их знаки и индексы.
И далее делаются еще какие-то преобразования, которые описаны весьма туманно. Именно для этих преобразований я и не могу создать алгоритм.
Поэтому моя реализация работает очччееень медлллееннно.
Поиск одного изображения занимает десятки секунд. И каждое изображение описывается 180 записями в БД. В то время как у эксперементаторов в книге в далеком 2002 году эта же процедура занимала не более 0,5 сек.
Вообщем то ищу человека, желательно математика, который бы мне разжевал несколько абзацев книги. Результативную консультацию готов оплатить.