Google принимается за визуальный поиск

Тема графического поиска уже поднималась на этих страницах, когда рассматривались компании Photodate, Picollator, разработчики которого имеют свой блог, и Idee Piximilar. Теперь в дело вступают тяжеловесы.
Компания Google в лице Yushi Jing и Shumeet Baluja на конференции WWW2008, проходившей 21-25 апреля 2008 в Пекине продемонстрировала свою разработку PageRank for Product Image Search (ссылка на PDF, 3,4 Mb), способную анализировать картинки не только по названию, как было раньше, но и по качеству, релевантности и, самое главное - по содержанию.
Сейчас поиск картинок в Google images работает на основе текста, так как ищет по названиям файлов. А так как названия могут присваиваться произвольно, картина выдачи удручает и веселит. Попробуйте ввести запрос mcdonalds. Вы найдёте на первой странице выдачи фотографии толстых жирафов, толстых женщин и толстых детей, что, безусловно, не имеет прямого отношения к запросу.
Наш подход полагается на анализ распределения визуальных подобий среди изображений.
Предпосылка проста: автор веб-страницы, вероятно, выберет изображения, которые, с его или её точки зрения, являются релевантными теме. Вместо того, чтобы предполагать, что каждый пользователь, который имеет веб-страницу, релевантную запросу, даст ссылку на изображение на странице другого пользователя, наш подход полагается на анализ объединенных предпочтений многих создателей содержания сети.
Новая система графического поиска от Google будет работать на основе так называемых «визуальных тем», которые можно объяснить как смысловые центры изображения.
Например, в иллюстрации многие изображения содержат знакомый символ «M». В некоторых изображениях эмблема - главный центр изображения, тогда как в других она занимает только маленькую часть. Тем не менее, её повторение в большой фракции изображений - важный сигнал, который может использоваться, чтобы вывести общую «визуальную тему» по всему набору. Обнаружение многократных визуальных тем и их относительных сил в большом наборе изображений - основа системы ранжирования изображения, предложенной в этом исследовании.
Подобно Page Rank (PR), вводится понятие Image Rank, IR. Формула Image Rank определяется так:

где S - нормализованная матрица схожести (normalized, symmetrical adjacency ma-
trix) образов, например S u,v обозначает визуальную схожесть картинок u и v.
Google уже продемонстрировал работу своего графического поисковика на примере 2000 самых популярных запросов в Google images.
Компания близка к представлению первой бета-версии графического поисковика.
Ссылка по теме: топик на recent-technology-news (англ.)
Блогобзор: А вы знаете, что такое Облако блогов?
Метки записи:Google, image search, visual searchПохожие записи
Понравился пост? Выскажись или подпишись на RSS, порадуй робота!


Реклама, маркетинг, web-разработка. 

Комментарии
Sorry, the comment form is closed at this time.