Перейти к содержанию

Picollator, поиск по мультимедийному содержимому


Рекомендуемые сообщения

В Интернете появилась уникальная поисковая система В Интернете появилась уникальная поисковая система Picollator, использующая мультимедийные запросы. Существующие поисковые системы предлагают пользователям искать картинки и сайты, используя только ключевые слова. Каждый, кто пытался хотя бы раз найти определенную фотографию или ресурс, на котором выложены нужные фотографии в Интернете, знает, что поиск не дает результатов, если не известно название файла или отсутствуют текстовые описания. Результаты поиска зависят от качества текстового запроса пользователя, качества текстового описания на сайте и алгоритма ранжирования ресурсов текстовыми поисковыми системами.

 

В 95% случаев пользователь получает в ответ на свой запрос большое количество ресурсов, лишь формально относящихся к сути запроса.

Проблема поиска релевантных источников может быть решена только путем использования контента в качестве запроса. Способ решения данной проблемы предложен российской компанией Recogmission, которая на сайте запустила онлайн-сервис Picollator - новую систему индексации и поиска ресурсов и изображений в Интернет. Для нахождения требуемого изображения и связанного с ним ресурса пользователю достаточно загрузить в качестве запроса пример желаемой картинки.

 

Результаты поиска зависят только от содержания контента и не требуют обязательного наличия текстовых описаний. Для улучшения результатов поиска в качестве дополнения к изображениям используются ключевые слова. Уникальной особенностью системы является способность находить ресурсы с изображениями похожих людей. При традиционном подходе к поиску, основанном на текстовых запросах, наличие в пояснениях к файлу соответствующих ключевых слов не означает, что на фотографиях действительно будут люди, или что это именно искомые персоны. Поиск Recogmission позволяет найти сайты, на которых размещены фотографии определенного человека или других людей, похожих на него.

 

Пользователь может загружать фотографии с несколькими людьми, и система найдет ресурсы с изображениями людей, похожих на все лица с фотографии-запроса. В результате возникает принципиально новое ранжирование результатов поиска, отличающееся от традиционных подходов концентрацией и на визуальном, и на формальном содержании.

Система основана на разработанных компанией оригинальных технологиях распознавания образов и индексации мультимедийной информации. Данные технологии в настоящее время обеспечивают возможность распознавать лица людей на цифровых изображениях и находить другие изображения с похожими лицами, составляя из них подобие библиотеки – мультимедийный индекс. использующая мультимедийные запросы. Существующие поисковые системы предлагают пользователям искать картинки и сайты, используя только ключевые слова. Каждый, кто пытался хотя бы раз найти определенную фотографию или ресурс, на котором выложены нужные фотографии в Интернете, знает, что поиск не дает результатов, если не известно название файла или отсутствуют текстовые описания. Результаты поиска зависят от качества текстового запроса пользователя, качества текстового описания на сайте и алгоритма ранжирования ресурсов текстовыми поисковыми системами.

 

В 95% случаев пользователь получает в ответ на свой запрос большое количество ресурсов, лишь формально относящихся к сути запроса.

Проблема поиска релевантных источников может быть решена только путем использования контента в качестве запроса. Способ решения данной проблемы предложен российской компанией Recogmission, которая на сайте запустила онлайн-сервис Picollator - новую систему индексации и поиска ресурсов и изображений в Интернет. Для нахождения требуемого изображения и связанного с ним ресурса пользователю достаточно загрузить в качестве запроса пример желаемой картинки.

 

Результаты поиска зависят только от содержания контента и не требуют обязательного наличия текстовых описаний. Для улучшения результатов поиска в качестве дополнения к изображениям используются ключевые слова. Уникальной особенностью системы является способность находить ресурсы с изображениями похожих людей. При традиционном подходе к поиску, основанном на текстовых запросах, наличие в пояснениях к файлу соответствующих ключевых слов не означает, что на фотографиях действительно будут люди, или что это именно искомые персоны. Поиск Recogmission позволяет найти сайты, на которых размещены фотографии определенного человека или других людей, похожих на него.

 

Пользователь может загружать фотографии с несколькими людьми, и система найдет ресурсы с изображениями людей, похожих на все лица с фотографии-запроса. В результате возникает принципиально новое ранжирование результатов поиска, отличающееся от традиционных подходов концентрацией и на визуальном, и на формальном содержании.

Система основана на разработанных компанией оригинальных технологиях распознавания образов и индексации мультимедийной информации. Данные технологии в настоящее время обеспечивают возможность распознавать лица людей на цифровых изображениях и находить другие изображения с похожими лицами, составляя из них подобие библиотеки – мультимедийный индекс.

Взято отсюда http://bp3.blogger.com/_PQi5pSHHvbo/R_nu7n.../Picollator.bmp

 

Провел небольшое тестирование ресурса.

 

Сначала попытался поискать изображение уже ставшей знаменитой "авторской работы" С.В. Кузнецова http://whitelline.livejournal.com/ Несмотря на многочисленные публикации этих сканов, Пиколатор их не нашел.

Затем попытался поискать фотографии того же С.В. Кузнецова по образцу, взятому с его сайта. Опять ничего не нашел..

 

"Ладно, фиг с ним, с Кузнецовым", подумал я и попытался найти фотографии Гитлера по одной из них. Результат был тот же: несмотря на наводненность Интернета этими изображениями, Пиколатор их не находит. Дальше тестировать расхотелось...

Ссылка на комментарий
Поделиться на другие сайты

На форуме есть специальные ветки посвещенные поисковикам и интернет ресурсам... Зачем захломлять форум...

1. А Вы, никак, модератором на общественных началах заделались? С чего Вы решили, что мне будут интересны Ваши непрошенные советы?

2. По поводу захламления форума... "Чем кумушек считать, трудиться, не лучше ли, кума, на себя оборотиться" (с) Или Вы всерьез считаете, что Ваши посты далеко от "захламления форума" ушли?

Ссылка на комментарий
Поделиться на другие сайты

  • 3 недели спустя...

Google завершает разработку нового графического поисковика

 

Интернет-компания Google в рамках конференции разработчиков в Пекине представила новое программное обеспечение, которое должно в корне изменить системы поиска графических изображений, сделав этот процесс более простым и эффективным.

 

Новое средство, получившее название PageRank for Image Product Search, применяет в поиске и анализе графических файлов те же принципы, что и поисковая машина компании при индексировании веб-страниц, в частности, новинка индексирует картинки не только по названию, но и по содержанию, релевантности и качеству.

 

"Графический поиск представляет для интернет-поисковиков серьезную проблему, так как поисковый механизм не способен распознать картинку точно также, как это делает человек. Большая часть механизмов, которые сейчас занимаются поиском графики, на самом деле такие же текстовые поисковики, так как реагируют на названия файлов. Новая же система работает непосредственно с изображениями", - говорят в Google.

 

В компании отмечают, что довольно близки к моменту представления первой бета-версии программы, которая действительно станет графическим поисковиком и будет работать с содержанием картинок и их релевантностью запросу.

 

Известно, что новая система будет работать с набором шаблонов, так называемых визуальных тем, которые будут содержать графику и описание тех или иных объектов. Система будет самообучающейся, то есть чем больше запросов через нее прошло, тем больше связей между картинками было создано и тем более точные результаты будут в итоге выданы.

 

Сортироваться картинки будут и по принципу похожести - программа будет находить основной предмет, изображенный на картинке и брать его за основу, одновременно с этим, если на картинке будут присутствовать и другие объекты, то они также будут проиндексированы, но им будет присвоен меньший коэффициент. В итоге после индексирования в базе поисковика будет создана многомерная индексная матрица, в которой объекты будут связаны по принципу "многие ко многим".

 

Например, при запросе пользователя "McDonalds" система в первую очередь предоставит картинки, где данному запросу соответствует наибольшее количество определений (логотипы, интерьер, продукты и проч), ранжироваться картинки будут по анализу веса каждого из объектов на картинке.

 

На сегодня в Google уже продемонстрировали свой алгоритм на примере 2000 самых популярных картинок, встречающихся в запросах на Google Images.

 

Год назад свой подход к данной проблеме представила и японская Hitachi, которая разработала новую технологию поиска информации, способную найти те или иные данные из миллионов документов буквально за считанные секунды, причем документы могут быть как текстовыми, так и графическими.

 

Разработка оценивает схожесть графических изображений на базе повторяющихся цепочек двоичных данных. В качестве ключевых данных, которые система берет для основы поиска, выступает самый широкий диапазон информации - текстовые последовательности, переходы цветов или распределение информации.

 

По словам представителей Hitachi, представленная разработка является усовершенствованием представленного ранее алгоритма, который использовал данные на жестких дискам и в ОЗУ ПК. Однако новая технология способна регистрировать изображения или документы и разбивать похожие по содержанию на кластеры. Каждый кластер представляет собой выборку по той или иной характеристике. Кластеров может быть сколь угодно много, поэтому реализуется технология многомерного поиска, сравнимая с работой нейронов головного мозга людей. При поступлении запроса технология сначала производит поиск по кластерам, затем, обнаружив несколько кластеров с подходящими данными, сужает поиск до групп документов, из которых состоят кластеры.

 

Инженеры компании говорят, что новая разработка способна практически мгновенно находить нужные данные из массы информации, а кроме того, заметно экономить память и процессорные ресурсы компьютера, когда поиск производится по "тяжелым" файлам, например фотографиям с высоким разрешением или видеофайлам.

 

http://www.cybersecurity.ru/net/47339.html

 

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.

×
×
  • Создать...