Перейти к содержанию

Site Sputnik - программа для поиска информации в Интернете


Рекомендуемые сообщения

Быть посредником не плохо. И СайтСпутник в целом справляется кстати с этим довольно хорошо (если изучить и привыкнуть к интерфейсу). Он хорошо собирает инфу со всех поисковиков, хорошо удаляет перекрестные страницы и выдает результат. На этом этапе стоит задать вопрос Вам: какова Ваша target group? Если это люди которым нужно все о том что они спрашивали из всех поисковиков в одном флаконе - эт одно. С этим прога справилась! Вопрос только еще один - кто эти люди? Может быть маркетологи изучающие рынок? Да и то я сомниваюсь что они перелопатят сотни этих ссылок.

Мне лично в работе не нужно знать все о моих объектах в интернете (пусть и объедененное в одно - тоисть без перекрестного мусора). Я просто Все-равно, то зерно что мне нужно я не отличу уже на тридцатой ссылке. Просто пропущу в силу рассеяния внимания... Мне в моей работе нужна программа которая бы сказала: "сведя все в одно я нашла *** ссылок. Вот они. Рекомендую тебе взглянуть на первые 10-15 в них ты найдеш 90% информации отраженной в твоем запросе. Особенно посмотри первые 5 это совершенно точно то, что тебе нужно." Да я упущу крупицу информации о моих объектах. Возможно, важную. Но кто сказал что я ее не упущу чисто механически просматривая сотни ссылок?! Глубокий поиск о котором Вы пишете в #39 конечно хорошо, но в реале я такого если чесн не встречал... особенно на СОТНИ-ТЫСЯЧИ ссылок... Хотя готов с Вами согласиться, что, возможно, уже в следующем посте в эту ветку напишет человек, который гневно скажет, мол я лично по каждому своему заданию дохожу до пятидесятой страницы яндекса сохраняя ясный ум и тверду память....

 

Если говорить Вашими словами, то оптовая база у Вас получилась хорошая! (если подробно изучить интерфейс - да хотяб и эти нестандартные свернуть/в окно/закрыть - кстати спасибо за пост, увидил, разобрался). Но в эту Вашу базу бы еще более продвинутого товароведа, который бы порекомендовал и полку на котором лежит тот товар что я ищу и еще посоветовал бы несколько товаров с самыми схожими характеристиками (или с наибольшим количеством характеристик) согласно моему запросу. Счас тоже товаровед есть, но проапгрейдить ему моск - было бы real help в моей работе.

Перелопатить сотни ссылок вручную действительно нереально. Здесь должны подключаться другие программные продукты обработки информации на локальном диске. СайтСпутник этим не занимется, по крайней мере, пока. Но в нем уже есть возможность выдать Вам списки ссылок в порядке близком к их значимости. Это как раз шаг в сторону того, о чем Вы написали: "Мне в моей работе нужна программа которая бы сказала: "сведя все в одно я нашла *** ссылок. Вот они. Рекомендую тебе взглянуть на первые 10-15 в них ты найдеш 90% информации отраженной в твоем запросе". Об этом написано в упомянутой выше инструкции. Это уже облегчает жизнь пользователю. Буду развивать аналитические средства и дальше. Аналитика должна "стоять" на полной информации, к чему и стремится СайтСпутник, собирая информацию из нескольких поисковиков и нескольких запросов. И, если эти запросы написаны грамотно, это пойдет только на пользу.

 

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...
  • Ответов 158
  • Создана
  • Последний ответ

Цитата от mamoed`а:

========================================

"Я в течение часа просматриваю двести страниц собранного текста и делаю выкладки на один абзац - и это полностью устраивает клиентов. А всего-то нужно: парсер, который все нужное собирает и сохраняет хотя бы в простом текстовом формате. Неужто так сложно?"

========================================

Попробую в СайтСпутнике сделать следующую функцию в ответ на "воззвание" mamoed`a. У меня это займет 15-30 дней (в дебри не полезу - сделаю попроще).

 

Предположим, что Вы проделали в СайтСпутнике работу и получили эти двести ссылок. Реализую их обход и вырезание из них фрагментов, удовлетворяющих заданному пользователем условию, например,

 

(2,Мыльников* Алексе*,4),

 

что означает выделить и сохранить из открытых (скачанных) ссылок фрагменты, содержащие слова Мыльников Алексей, в которых взяты левее 2 предложения и правее 4 предложения. Здесь очень полезно отфильтровать повторы фрагментов. Пусть пока и "Мыльников Алексей" и "Алексей Мыльников" удовлетворяют условию поиска фрагментов. Пусть вызежу только текстовую составляющую фрагментов. "Окружу" работу с фрагментами "небольшим" сервисом, в частности, связь с первоисточником. Думаю такая функция будет очень кстати в программе, предназначенной для поиска и сбора информации. Собираюсь назвать функцию, например, "контекстный граббер".

 

Прошу высказаться по этому поводу. Есть ли какие-либо рекомендации, пожелания, требования?

Может быть Вы видите граббер по-другому? Удачно ли это название?

Что еще полезного можно сделать на группе скачанных ссылок?

Ссылка на комментарий
Поделиться на другие сайты

  • 4 недели спустя...
  • 3 месяца спустя...

Вышла новая версия SiteSputnik 4.2.1.

 

Новое.

1. Монтиторинг веб-страниц (ссылок) на предмет изменения их содержания (контента). Найденные изменения выделяются цветом и специальными знаками.

2. Возможность хранения любого количества отмониторенных страниц в базе данных и мониторинга относительно любого сохраненного состояния страницы.

3. Билистинг и N-листинг для удобства просмотра и визуального сравнения любых документов.

 

Это Бета версия мониторинга контента страниц. Некоторые его функции находятся в стадии разработки.

Подробнее в параграфе 2 инструкции, размещенной здесь - http://ab.vlink.ru/FFF/Help/SSInstr/SSMonitoring.htm _ttp://ab.vlink.ru/FFF/Help/SSInstr/SSMonitoring.htm

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...