Quickribbon

Google принимается за визуальный поиск

google-images-now.png

Тема графического поиска уже поднималась на этих страницах, когда рассматривались компании Photodate, Picollator, разработчики которого имеют свой блог, и Idee Piximilar. Теперь в дело вступают тяжеловесы.

Компания в лице Yushi Jing и Shumeet Baluja на конференции WWW2008, проходившей 21-25 апреля 2008 в Пекине продемонстрировала свою разработку PageRank for Product Image Search (ссылка на PDF, 3,4 Mb), способную анализировать картинки не только по названию, как было раньше, но и по качеству, релевантности и, самое главное - по содержанию.

Сейчас поиск картинок в images работает на основе текста, так как ищет по названиям файлов. А так как названия могут присваиваться произвольно, картина выдачи удручает и веселит. Попробуйте ввести запрос mcdonalds. Вы найдёте на первой странице выдачи фотографии толстых жирафов, толстых женщин и толстых детей, что, безусловно, не имеет прямого отношения к запросу.

Наш подход полагается на анализ распределения визуальных подобий среди изображений.

Предпосылка проста: автор веб-страницы, вероятно, выберет изображения, которые, с его или её точки зрения, являются релевантными теме. Вместо того, чтобы предполагать, что каждый пользователь, который имеет веб-страницу, релевантную запросу, даст ссылку на изображение на странице другого пользователя, наш подход полагается на анализ объединенных предпочтений многих создателей содержания сети.

Новая система графического поиска от будет работать на основе так называемых «визуальных тем», которые можно объяснить как смысловые центры изображения.

Скачать большую картинку

Например, в иллюстрации многие изображения содержат знакомый символ «M». В некоторых изображениях эмблема - главный центр изображения, тогда как в других она занимает только маленькую часть. Тем не менее, её повторение в большой фракции изображений - важный сигнал, который может использоваться, чтобы вывести общую «визуальную тему» по всему набору. Обнаружение многократных визуальных тем и их относительных сил в большом наборе изображений - основа системы ранжирования изображения, предложенной в этом исследовании.

Подобно Page Rank (PR), вводится понятие Image Rank, IR. Формула Image Rank определяется так:

image-rank.gif

где S - нормализованная матрица схожести (normalized, symmetrical adjacency ma-
trix) образов, например S u,v обозначает визуальную схожесть картинок u и v.

уже продемонстрировал работу своего графического поисковика на примере 2000 самых популярных запросов в images.

Компания близка к представлению первой бета-версии графического поисковика.

Ссылка по теме: топик на recent-technology-news (англ.)

Блогобзор: А вы знаете, что такое Облако блогов?

Метки записи:, ,

Похожие записи

Понравился пост? Выскажись или подпишись на RSS, порадуй робота!

online poker
Комментарии

В действительности это очередная шумиха, которая поднимается, как только Google чихнет. Если прочитать указанную публикацию, а также собственное заявление компании, то становится ясно, что это лишь исследования, и они пока очень далеки от воплощения. Кстати, в отличие от систем, которые ранее в данном блоге освещались и которые имеют действующие версии движков. Скорее всего, в итоге Google или Microsoft купят одну из этих компании (или все :) ), и вот тогда что-то заработает.

Alexis, вы не из Picollator’a?
На мой проницательный взгляд :) движки освещавшихся ранее в блоге компаний на данный момент далеки от человеческого идеала поиска.
Т.е. они ищут всё правильно (с т.зр. робота): и цвета соответствуют, и формы, а находится всё не то.
Как раз от Google можно ожидать чего-либо более серьёзного.
Все предпосылки есть. Кроме того, формулы ранжирования у всех пречисленных систем пока не наблюдается, насколько мне известно, а это для Google - приоритет.
Что ж, поживём-увидим.

Sorry, the comment form is closed at this time.