  |
|
Copyright © 2007-2010 IMAGIUM
|
|
|
|
|
|
Индексирование и поиск изображений в Интернет - технология IMAGIUM
|
|
Что значит «визуальный контентный поиск»?
Поиск картинок по тому, что на них изображено в действительности. Поиск фотографий по информации, содержащейся «внутри»
них, а не в окружающем тексте.
Как работает контентный поиск изображений?
Очень похоже на то, как происходит поиск web-страниц по словам в текстовых поисковых машинах. Из каждого изображения выделяются
характерные фрагменты, обладающие специфическим набором признаков - "слова". Далее, в зависимости о того, в "текст"
каких изображений входят те или иные слова, строится индекс, позволяющий быстро определять картинки, более всего соответствующие
любому набору заданных ключевых "слов".
В свою очередь, изображение, используемое для поиска, также разбирается на предмет наличия "слов". По полученным
словам и происходит поиск - в точности также, как и в текстовой поисковой системе.
Что произойдет, если исходное изображение изменится, например фотография будет сделана под другим углом?
Также, как и при текстовом поиске, слова могут изменяться, образуя словоформы и переходя друг в друга. Аналогично правилам склонения
существительных или спряжения глаголов существуют правила, по которым "слова" изображений переходят друг в друга при
различных преобразованиях и искажениях исходной картинки. Алгоритмы IMAGIUM позволяют определять любые переходы между
словами как допустимые или нет, в зависимости от конкретной задачи. Например, можно считать позитивные и негативные изображения
совершенно одинаковыми, а можно различными.
Распознает ли компьютер, что изображено на фотографии?
Нет. Опять же, как и текстовые поисковые машины (по крайней мере, большинство их), которые не сильно вдаются в смысл написанного
и ориентируются больше на статистику встречаемости и популярности слов, количество взаимных ссылок между документами и прочие формальные
признаки. Пока можно лишь говорить о том, что семантика как текстов, так и изображений - это следующий этап осмысления задачи
поиска информации. Однако, уже сегодня существует множество возможностей для применения визуального контентного поиска -
библиотеки маркетинговых и дизайнерских фотоматериалов, системы HR, охрана авторских и патентных прав, фото- и кино-архивы,
реестры произведений искусства и много чего еще.
Что такое сервис IMAGIUM?
Сервис IMAGIUM предоставляет возможность для любой внешней системы (системы-клиента) организовать одно или несколько логических
пространств (т.н. matchpoints), где будут регистрироваться операции с изображениями и вестись поисковые индексы, позволяющие производить
быстрый поиск изображений в пределах логического пространства. Взаимодействие с IMAGIUM осуществляется через две web-службы: WS1 и WS2. Служба
WS1 предназначена для учета операций с изображениями во внешней системе и для внесения соответствующих изменений в поисковые
индексы. Служба WS2 предназначена для выполнения визуального контентного поиска. Ниже все это проиллюстрировано на картинке:
IMAGIUM не требует доступа к оригиналам графических объектов, хранящихся во внешней системе - взаимодействие с сервисом происходит
посредством изображений ограниченного разрешения (0.3 - 1.0 Мегапихелей) и их идентификаторов во внешней системе (численный ID
или текстовый URL).
Результат выполненного поискового запроса предоставляется в виде списка "идентификатор - метрика сходства", который может быть
произвольным образом использован во внешней системе.
По всем вопросам, касающимся технологий IMAGIUM, Вы можете обратиться по адресу imagium@yandex.ru
|
|
|