Перейти к содержанию

Site Sputnik - программа для поиска информации в Интернете


Рекомендуемые сообщения

Цитата от CI-KP:

"Спутник в поиске умеет убирать дубли. Это хорошо. Но я тоже умею. Прямо в поисковиках.

Поэтому плюсом Спутника это не считаю."

А в поисковиках ничего убирать и не надо - они выдают ссылки без дублей.

Не совсем так. Один и тот же текст с разных сайтов вполне может попасть в выборку. или один и тот же контекст - например, анекдоты по теме, по которой мы проводим поиск. Я этот мусорный контекст убираю.

 

 

Цитата от CI-KP:

"Аналитическое объединения в поисковиках тоже возможно, но в Спутнике оно удобнее."

Согласен, да возможно, удобнее - да удобнее, и добавлю АО в Сайтспутнике качественно мощнее.

Возможно, это так и есть, не буду спорить. Хотя аргументация бы не повредила. Я вижу, что объединение удобно, поэтому и написал по нему обзор. Действительно, объединить на одной странице данные по пересечению объектов из разных поисковиков по-другому пока невозможно. Это без Спутника придется делать вручную по каждому поисковику отдельно и вручную же убирать дубли.

 

 

Цитата от CI-KP:

"Спутник однозначно хорош для тех, кто не знает языка запросов поисковиков. Для остальных его

удобство в этом плане не так очевидно."

Согласен с первым, несогласен со вторым.

Ну, безусловно, я и Иоанн - это всего два человека. Мы с ним прежде всего личное мнение выразили. Просто оно в этом плане совпало.

Вы можете прислушаться к нему полностью или частично, а можете и не прислушиваться.

 

Цитата от CI-KP:

"Есть и минусы Спутника: в поисковике я могу сразу глянуть кэш, а в Спутнике для этого

отдельные "прихлопы" и "притопы" нужны".

Не согласен - нажимайте также как и в поисковике на "Сохраненная копия" и т.п. и просматривайте его.

ОК. Соглашусь, что это в Спутнике не хуже, чем в поисковике.

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 158
  • Создана
  • Последний ответ

А о чем шум-то? Полезная или нет прога? Дак это народ рублем проголосует. Если брать не будут значит не нужна. Если будут брать значит полезна. Рано или поздно все станет ясно. И неь смысла ломать копья. Мне например такой софт вроде как не к чему. Хотя прикольная функция есть. Когда в любом доке копируешь фрагмент и выкладываешь в определенный файл. Удобно при составлении отчета. Только вот работает как то коряво :smile17:

Ссылка на комментарий
Поделиться на другие сайты

А о чем шум-то? Полезная или нет прога? Дак это народ рублем проголосует. Если брать не будут значит не нужна. Если будут брать значит полезна. Рано или поздно все станет ясно. И неь смысла ломать копья. Мне например такой софт вроде как не к чему. Хотя прикольная функция есть. Когда в любом доке копируешь фрагмент и выкладываешь в определенный файл. Удобно при составлении отчета. Только вот работает как то коряво :smile17:

Уважаемый Алексей, как разработчик, хочет сосредоточиться на востребованных направлениях и не тратить время на невостребованные.

 

Его интересует, в первую очередь, польза от программы и уже совсем во вторую, с большим отставанием - рентабельность проекта. Поэтому Алексей хотел бы сделать продукт, который будет "на ура" принят специалистами, как в своей области применения WebSite Watcher востребован. Причем, есть очень уважаемые специалисты, которым функционал программы нравится. А значит, есть вероятность, что мы просто не полностью понимаем какие-то нюансы. Об этом и диалог.

Ссылка на комментарий
Поделиться на другие сайты

Возможно, это так и есть, не буду спорить. Хотя аргументация бы не повредила. Я вижу, что объединение удобно, поэтому и написал по нему обзор. Действительно, объединить на одной странице данные по пересечению объектов из разных поисковиков по-другому пока невозможно. Это без Спутника придется делать вручную по каждому поисковику отдельно и вручную же убирать дубли.

Пожалуйста, аргументация.

Обратимся к конкретному примеру, но только не к элементарному примеру типа "завод "Серп и Молот",

а к более сложному и актуальному примеру.

 

Предположим Вам надо "пробить" информацию по холдингу "X".

Вам заплатили очень хорошие деньги за эту работу, но и возложили еще большую ответственность за

ТОЧНОСТЬ и ПОЛНОТУ предоставляемой информации, то есть чего-то нашел - молодец, не нашел - и бог

с ним, такое решение не устроит: неполная информация - родная сестра дезинформации за деньги заказчика.

 

Предположим у Вас уже есть информация:

- четыре названия компаний, входящих в холдинг,

- пять телефонных номеров городских,

- три E-mail"а,

- два сотовых телефона,

- три адреса (юр. или почтовых - все равно),

- ФИО двух учредителей ( а ЭТО ОКОЛО 30 ЗАПРОСОВ ПО КАЖДОМУ, но пусть 10 по каждому),

- ФИО двух генеральных директоров и двух заместителей (40 запросов).

 

В результате первичного исследования проблемы Вы обнаружите, например,

- еще одну фирму,

- еще два телефона,

- еще одно ФИО учредителя и ФИО двух руководителей (30 запросов),

- один юр. и один почтовый адрес.

 

Нужно выполнить каждый запрос (а у нас их пока всего только 82, и я значительно приуменьшил эту цифру).

 

Но идем дальше.

Одного Яндекса здесь недостаточно (по моей статистике он, не принесет и половины ссылок, другие поисковики

не лучше, могу средствами СайтСпутника сделать и более точную статистику, но не в этом сообщении).

По минимуму надо взять еще Гугль, Яху, и я бы взял еще Рамблер, да и неплохо посмотреть информацию в блогах

Яндекса и Гугля, а еще как правильно подметил в одном из предыдущем сообщении уважаемый Николаевич

(хорошо бы "подключать" еще и произвольные специальные поисковые средства - этого механизма в SateSputnik"е

пока нет, но надеюсь будет - испытываю давление в этом направлении от почти всех своих пользователей).

Итого: набрали мы 82*4=328 запросов. Многие из этих запросов, написанных на языке запросов конкретных

поисковиков, будут далеко не двух-трех словные и содержать не по одному-два операнда.

 

Идем дальше.

Для решения поставленной задачи необходим глубокий поиск - надо будет пройтись для каждого из 328 запросов

не по 2-3 первым страницам, а до последней страницы, до последней ссылки.

 

Пожалуйста, уважаемый коллеги, начинайте в своей фирме выполнение этого заказа, имея в штате N сотрудников.

Что делать после получения первой страницы для первого запроса, имея в распоряжении только поисковики,

как советовали некоторые коллеги? Очевидно, что выполнить качественно поставленную задачу только на поисковых

машинах без дополнительных средств автоматизации будет очень трудно, а в данном случае непосильно.

Используя SiteSputnik - намного проще. С поиском и сбором информации справится один сотрудник за очень скромное

время, которое уйдет у него на заточку (не обязательно в СайтСпутнике) и ввод в пакет СайтСпутника

328 запросов. Остальное сделает СайтСпутник - и ни одного дубля ссылки, ни одной два раза скачанной одной

и тойже web-страницы или другого документа не будет. Естественно, что эту информацию еще надо проанализировать,

но сейчас речь о поисковых возможностях СайтСпутника.

 

И это еще не все. После окончания работ или в процессе работ обнаруживаются:

- еще одна фирма,

- еще четыре телефона,

- еще одно ФИО учредителя и ФИО двух руководителей,

- один юр. и один почтовый адрес.

 

В СайтСпутнике Вы легко отдельно "вычислите" информацию по этим подоъбектам и объедините с вычисленной ранее

информацией. Если и после этого "всплывет", например, еще что-то, то оно тоже, точнее только новое, из него

приплюсуется к уже найденному.

 

Еще одна ОЧЕНЬ ВАЖНАЯ ПРОБЛЕМА.

Вы обязаны на случай ПРЕТЕНЗИЙ со стороны ЗАКАЗЧИКа суметь отстоять честь фирмы и доказать, что на момент исследования

проблемы не было какой-то информации в интернете или наоборот такая информация была! СайтСпутник автоматически

сохранит все протоколы Вашей работы, все страницы поисковиков и скачанные Web-страницы. И Вы сумете доказать,

через месяц или два года, ссылаясь на них (я надеюсь, что у заказчика тоже будет электронная копия протоколов

Вашей работы), что информация была или ее не было! Вам не придется сохранять вручную по папкам около 328*20=6560

страниц поисковиков из браузера или вочера. Найденные веб-страницы тоже автоматически сохранятся в

базе данных СайтСпутника. У Вас останется автоматически созданный, образно говоря, КЭШ всей решенной вами задачи

на момент ее решения.

 

Да, речь шла о пересечении объектов, а рассказал я о поиске и сборе информации. Один объект - холдинг "X"

мы вычислили. Если требуется найти, где он пересекается с другими объектами, то они вычисляются аналогичным

способом, а затем на них задается аналитическое объединение.

 

Это было поянение к тому, что осмеянное уважаемым Иоанном (я считаю, что такое пренебрежительное

отношение к коллеге некорректно даже, если и Иоанн прав) аналитическое объединение в СайтСпутнике

мощнее, чем логическое "И" в Яндексе.

Ссылка на комментарий
Поделиться на другие сайты

Вот здесь находится развилка:

Очевидно, что выполнить качественно поставленную задачу только на поисковых

машинах без дополнительных средств автоматизации будет очень трудно, а в данном случае непосильно.

Используя SiteSputnik - намного проще. С поиском и сбором информации справится один сотрудник за очень скромное

время, которое уйдет у него на заточку (не обязательно в СайтСпутнике) и ввод в пакет СайтСпутника

328 запросов. Остальное сделает СайтСпутник - и ни одного дубля ссылки, ни одной два раза скачанной одной

и тойже web-страницы или другого документа не будет. Естественно, что эту информацию еще надо проанализировать,

Во-первых, ничего не очевидно. Спутник уберет дубли одной и той же страницы на одном и том же адресе. Но он не уберет одну и ту же информацию на разных адресах. А в процессе поиска это приходится делать довольно часто.

Убрать одни и те же данные, разбросанные в 200 каталогов, которые фирма "наоптимизировала" в поисковике несложно. В Спутнике тоже, в принципе, но зачем мне десять раз скачивать к себе весь интернет? Что героического в том, чтобы получить 5000 страниц, которые читать уже никто не сможет?

Обычно при поиске так и идут: убеждаются, что одна и та же информация повторяется и отсекают ее всю.

 

Вообще, проблема "когда прекращать поиск в Интернете" довольно объемная. А, например, учитывая, что американский Интернет еще пару лет назад был в 30 раз больше российского, проблема "найти вообще всё" с каждым днем все сильнее становится похожа на проблему создания "информационного пылесоса", которая решения по определению не имеет. Есть и технические ограничения, через которые не перепрыгнешь, в том числе на Спутнике - как-то длина строки Яндекса или 32 слова в максимально длинном запросе в Гугле. Это я к вопросу о "собрать вообще всё".

 

Мне, скажу честно, никакого удовольствия не доставляло смотреть, как Спутник сгребает мне весь Интернет на компьютер.

Более того. Я в своей работе, как только получаю нужный промежуточный результат, ставлю его в WebSite watcher и его можно

1. Мониторить в динамике (я знаю, что Спутник для этого не предназначен, но мне надо не Спутник ради спутника эксплуатировать, а надо работу делать)

 

2. Сделать в конце работы архив закладок в Вочере и передать его заказчику или положить в сейф. Особо красивые страницы можно в прилагаемом LocalWebsite Archive сохранить.

 

Кроме того, мне известен только один человек, который гордился 400-страничным отчетом. "Эксперт комитета Госдумы по законодательству". Так вот, этого эксперта с 199какого-то года к Госдуме на пушечный выстрел не подпускают. Разведка не мусор гребет ковшом, чтобы весь этот ковш с горкой передать заказчику, а собирает материал по конкретной проблеме. И потом его анализирует, как вы справедливо заметили. И это очень серьезный момент.

 

Поэтому я солидарен с Иоанном и Мутным в этом вопросе.

 

И последний вопрос по списку (который я обычно очень не люблю обсуждать). Иоанн, на мой взгляд, вам нисколько не нахамил. Он вел себя совершенно корректно. И просто высказал Вам свое мнение. Если Вы не станете впредь поднимать вопросы интонаций, я был бы вам очень признателлен. Здесь эмоции не запрещены, конечно, но не очень приветствуются, когда они перемешиваются с деловыми вопросами.

 

Понимаете, Алексей, когда специалист видит WebSite Watcher, он говорит "wow!". Когда он понимает, что Вочер его уже не устраивает, он "wow!" не говорит, но берет Аваланч и со вздохом начинает его осваивать (просто Аваланч продвинутее Вочера в ряде вопросов, но и в освоении сложнее). Когда специалисту не нравится Аваланч, т.к. не устраивает по своим возможностям, он идет к Андрею Масаловичу и просит продемонстрировать продвинутые и дорогие версии Аваланча. Потом идет и смотрит семантический архив. Это уже те деньги, когда все расскажут и покажут, и учить специально будут, т.к. и сложность выше.

Я знаю, еще раз говорю, что Спутник не показывает обновлений. Я рассказываю эти примеры для того, чтобы было понятнее.

 

А когда берешь Спутник, выгоды для меня неочевидны. За исключением аналитического объединения. Аналитическое объединение Спутник делает хорошо, и спасибо за это. Так мы это и признаем. а там, где выгод нет и их не получается увидеть мы об этом тоже прямо говорим.

 

ОК. Позовите сюда тех пользователей, которые довольны и давайте попросим их на примерах, которые не являются секретными, рассказать о том, почему для человека, знающего язык запросов поисковиков, удобнее пользоваться Спутником.

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...