Google принимается за визуальный поиск Google taken as a visual search

google-images-now.png

Тема графического поиска уже поднималась на этих страницах, когда рассматривались компании Photodate , Picollator , разработчики которого имеют свой блог , и Idee Piximilar . Subject image search has already been raised in these pages, which dealt with the company Photodate, Picollator, developers who have their blogs, and Idee Piximilar. Теперь в дело вступают тяжеловесы. Now to come heavyweights.

Компания Google в лице Yushi Jing и Shumeet Baluja на конференции WWW2008, проходившей 21-25 апреля 2008 в Пекине продемонстрировала свою разработку PageRank for Product Image Search (ссылка на PDF, 3,4 Mb), способную анализировать картинки не только по названию, как было раньше, но и по качеству, релевантности и, самое главное - по содержанию. Google is represented by Yushi Jing and Shumeet Baluja at the conference WWW2008, held from 21-25 April 2008 in Beijing has demonstrated its development of PageRank for Product Image Search (link to PDF, 3,4 Mb), capable of analyzing images not only by name, as it was earlier, but also on quality, relevance and most importantly - the content.

Сейчас поиск картинок в Google images работает на основе текста, так как ищет по названиям файлов. Now image search in Google images works on the basis of the text, as well as searches for the file name. А так как названия могут присваиваться произвольно, картина выдачи удручает и веселит. And because the names may be assigned at random pattern issuing disappointing and fun. Попробуйте ввести запрос mcdonalds . Try request mcdonalds. Вы найдёте на первой странице выдачи фотографии толстых жирафов, толстых женщин и толстых детей, что, безусловно, не имеет прямого отношения к запросу. You will find on the first page of issuing photo Giraffes thick, thick women and children thick, which is certainly not directly relevant to the query.

Наш подход полагается на анализ распределения визуальных подобий среди изображений. Our approach relies on the analysis of visual similarities among images.

Предпосылка проста: автор веб-страницы, вероятно, выберет изображения, которые, с его или её точки зрения, являются релевантными теме. The premise is simple: the author of a Web page is likely to choose an image, which in his or her opinion, are relevant to the topic. Вместо того, чтобы предполагать, что каждый пользователь, который имеет веб-страницу, релевантную запросу, даст ссылку на изображение на странице другого пользователя, наш подход полагается на анализ объединенных предпочтений многих создателей содержания сети. Rather than assume that anyone who has a Web page, the relevant inquiry, will link to the image on the page of another user, our approach relies on the analysis of the combined preference of many creators of the content network.

Новая система графического поиска от Google будет работать на основе так называемых «визуальных тем», которые можно объяснить как смысловые центры изображения. The new image search on Google will work on the basis of the so-called «visual order», which can be explained as a semantic center of the image.

Download Pictures

Например, в иллюстрации многие изображения содержат знакомый символ «M». For example, illustrate the many images contain a familiar symbol «M». В некоторых изображениях эмблема - главный центр изображения, тогда как в других она занимает только маленькую часть. In some Emblem - the center of the image, while in others it is only a small part. Тем не менее, её повторение в большой фракции изображений - важный сигнал, который может использоваться, чтобы вывести общую «визуальную тему» по всему набору. Nevertheless, its recurrence in a large fraction of images - an important signal, which can be used to raise the overall «visual theme» to recruit. Обнаружение многократных визуальных тем и их относительных сил в большом наборе изображений - основа системы ранжирования изображения, предложенной в этом исследовании. The discovery of multiple visual themes and their relative power in a large set of images - the basis of ranking images proposed in the study.

Подобно Page Rank (PR), вводится понятие Image Rank, IR. Like the Page Rank (PR), introduces the concept of Image Rank, IR. Формула Image Rank определяется так: Formula Image Rank is determined as follows:

image-rank.gif

где S - нормализованная матрица схожести (normalized, symmetrical adjacency ma- where S - normalized matrix similarity (normalized, symmetrical adjacency ma -
trix) образов, например S u,v обозначает визуальную схожесть картинок u и v. trix), for example S u, v indicates a visual similarity of images u and v.

Google уже продемонстрировал работу своего графического поисковика на примере 2000 самых популярных запросов в Google images. Google has already demonstrated his graphic work on the example of search engine 2000 most popular queries to Google images.

Компания близка к представлению первой бета-версии графического поисковика. The company is close to presenting the first beta version of the graphic search engine.

Ссылка по теме: топик на recent-technology-news (англ.) Links: Top on the recent-technology-news (en)

Блогобзор : А вы знаете, что такое Облако блогов ? Blogobzor: And you know what a cloud of blogs?


Самое вкусное в RSS-рассылке ! The most delicious in the RSS-mailing!
Метки записи: Google , image search , visual search Tags record: Google, image search, visual search

Похожие записи Related Articles

Понравился пост? Выскажись или подпишись на RSS , порадуй робота! Like the Post? Express or subscribe to RSS, will make the robot!

Комментарии Comments

В действительности это очередная шумиха, которая поднимается, как только Google чихнет. In fact, this is another brouhaha, which rises as soon as Google chihnet. Если прочитать указанную публикацию, а также собственное заявление компании, то становится ясно, что это лишь исследования, и они пока очень далеки от воплощения. If you read the said publication, as well as a statement own company, it becomes clear that this is only a study, and they are still very far from realization. Кстати, в отличие от систем, которые ранее в данном блоге освещались и которые имеют действующие версии движков. By the way, as opposed to systems that were previously on this blog covered and which are versions of existing engines. Скорее всего, в итоге Google или Microsoft купят одну из этих компании (или все :) ), и вот тогда что-то заработает. Most likely, as a result of Google or Microsoft Buy one of these companies (or all:)), and then something goes.

Alexis, вы не из Picollator’a? Alexis, you're not from Picollator'a?
На мой проницательный взгляд :) движки освещавшихся ранее в блоге компаний на данный момент далеки от человеческого идеала поиска. In my eagle-eyed view:) engines covered earlier in the blog companies at the moment far from the ideal of human search.
Т.е. Ie они ищут всё правильно (с т.зр. робота): и цвета соответствуют, и формы, а находится всё не то. they're looking for is the right place (with t.zr. robot): and match colors and forms, but is not all that.
Как раз от Google можно ожидать чего-либо более серьёзного. Just from Google, you can expect something more serious.
Все предпосылки есть. All the preconditions are. Кроме того, формулы ранжирования у всех пречисленных систем пока не наблюдается, насколько мне известно, а это для Google - приоритет. In addition, the formula for ranking among all prechislennyh systems are not yet there, as far as I know, but it is for Google - a priority.
Что ж, поживём-увидим. Well, wait-see.

Оставьте комментарий Leave a comment

правила комментирования Rules comment

Если вы комментируете впервые, или в комментарии больше одной ссылки, ваш комментарий появится после модерации. If you kommentiruete the first time, or in the commentary more than one link, your comment will appear after moderation.
Комментарии, имеющие смысл только для поисковых роботов, будут неизменно удаляться. Comments that are meaningful only for search robots will always be deleted.

(required)

(required)