Перейти к содержимому


Site Sputnik - программа для поиска информации в Интернете


  • Страниц
  • 1
  • 2
  • 3
  • 4
  • Авторизуйтесь для ответа в теме
Сообщений в теме: 158

#11 shizgara

shizgara

    Подозрительный тип

  • Members
  • 12 сообщений

Отправлено 24 Февраль 2008 - 21:58

Цитата(Alexei Mylnikov @ 22.2.2008, 17:29) <{POST_SNAPBACK}>
Готовлю к выходу новую версию программы. Ориентировочная дата ее выхода - середина марта.
В этой версии будет реализована функция, позволяющая обнаружить ресурсы, где пересекаются любые выбранные пользователем объекты. Это позволит, например, обнаружить страницы, на которых упоминаются Иванов И.И., Петров П.П. и Сидоров С.С. Или только Иванов и Петров без Сидорова и так далее. Либо где пересекаются гораздо более сложные объекты, формулировки и термины.
В функции смогут участвовать одновременно несколько поисковиков - Яндекс, Гугль и некоторые другие. В дальнейшем функция распространится и на произвольные Web-страницы.
Прошу высказаться - насколько в работе может оказаться полезна обратная функция - формирование списка ссылок, где выбранные объекты не пересекаются друг с другом?


Построение сложного запроса потребует места. В одну строчку уже все не уместишь.  Например, интересуют ссылки, в которых упоминается Ленин и Сталин, причем под разными именами.
Тогда удобнее писать запрос в несколько строчек:

Ленин (Ульянов, Крупский, "вождь мирового пролетариата")
+
Сталин (Коба, Джугашвили, генералисимус)

А это уже конструктор запросов. Жалко, что поисковики пока недружелюбны в этом смысле. Не подумайте, что это претензия. Просто новые возможности - это новые проблемы.

#12 Скиф

Скиф

    Доверенное лицо

  • Users
  • 689 сообщений

Отправлено 24 Февраль 2008 - 22:53

Спасибо Всем.Принял к сведению.Возму на вооружение.

#13 Alexei Mylnikov

Alexei Mylnikov

    Подозрительный тип

  • Members
  • 83 сообщений

Отправлено 25 Февраль 2008 - 06:26

Цитата(shizgara @ 25.2.2008, 0:58) <{POST_SNAPBACK}>
Построение сложного запроса потребует места. В одну строчку уже все не уместишь.  Например, интересуют ссылки, в которых упоминается Ленин и Сталин, причем под разными именами.
Тогда удобнее писать запрос в несколько строчек:

Ленин (Ульянов, Крупский, "вождь мирового пролетариата")
+
Сталин (Коба, Джугашвили, генералисимус)

А это уже конструктор запросов. Жалко, что поисковики пока недружелюбны в этом смысле. Не подумайте, что это претензия. Просто новые возможности - это новые проблемы.

По поводу многострочного запроса - мне эта простая мысль понравилась. Дейсвительно, иногда это будет удобнее. Доделаю перекрестный анализ ссылок, найденных поисковиками по разным запросам, и сделаю.  В настоящее время можете воспользоваться пакетом запросов в SiteSputnik"е.
Но в пакете каждая строчка - отдельный запрос, и по этим запросам можно получить объединенный результат или выполнить запросы независмо (раздельно) друг от друга.

#14 CI-KP

CI-KP

    .

  • Users
  • 6 914 сообщений

Отправлено 25 Февраль 2008 - 07:23

Цитата(shizgara @ 25.2.2008, 0:58) <{POST_SNAPBACK}>
Жалко, что поисковики пока недружелюбны в этом смысле.

Вполне дружелюбны. Делаете запрос в форме расширенного поиска поисковика - получаете  сконструированную им автоматически поисковую фразу. Ее ставите в Спутник (или смотрите в браузере, это, как показала практика, дел вкуса). Сильно сложный запрос действительно так не сделаешь - надо знать язык запросов и расширенный поиск его не сконструирует - но менее сложные запросы вполне можно так делать.

#15 shizgara

shizgara

    Подозрительный тип

  • Members
  • 12 сообщений

Отправлено 29 Февраль 2008 - 09:43

Цитата(CI-KP @ 25.2.2008, 9:23) <{POST_SNAPBACK}>
Вполне дружелюбны. Делаете запрос в форме расширенного поиска поисковика - получаете  сконструированную им автоматически поисковую фразу. Ее ставите в Спутник (или смотрите в браузере, это, как показала практика, дел вкуса). Сильно сложный запрос действительно так не сделаешь - надо знать язык запросов и расширенный поиск его не сконструирует - но менее сложные запросы вполне можно так делать.


Так я про тоже. Расширеный поиск хорош, пока покрывает задачи.
Например, расширенный поиск в Яндекс Новости не ищет отдельно в заголовках, а в Google News ищет.
Расширеный поиск в Яндекс Новости позволяет прокручивать список источников, а расширенный поиск в Google Новости "подсказывает" возможные источники при вводе первых букв.
У каждого варианта есть свои возможности и ограничения. Конечно, лучше знать язык запросов. Но иметь простенький редактор-конструктор, где по горячим клавишам можно собирать сложные запросы из заготовленных фрагментов я бы не отказался.
Упс. Понесло... Начал с многострочного запроса, а закончил горячими клавишами...

Сообщение отредактировал shizgara: 29 Февраль 2008 - 09:45


#16 eduard

eduard

    кот генеральский

  • Users
  • 1 512 сообщений

Отправлено 29 Февраль 2008 - 09:47

Цитата(shizgara @ 29.2.2008, 12:43) <{POST_SNAPBACK}>
...
Упс. Понесло... Начал с многострочного запроса, а закончил горячими клавишами...

Да нет, вот голосовой набор - это бы понесло.

#17 Alexei Mylnikov

Alexei Mylnikov

    Подозрительный тип

  • Members
  • 83 сообщений

Отправлено 20 Март 2008 - 08:31

В сообщении #6 от 22.02.08 говорилось о функции,
позволяющей обнаружить ресурсы (ссылки), где пересекаются любые
найденные пользователем объекты (так называемые семантические связи
объектов). В новой версии SiteSputnik 4.1.3.1 реализована такая возможность.

Анализируемые ресурсы могут быть получены следующими способами.
1. Поисковиками: Яндекс, Гугль, Яху, Рамблер, Mail, Апорт на глубину заданного количества страниц.
2. Метапоиском на базе указанных поисковиков.
3. При помощи Яндекс-блоги, Яндекс-комментарии, Гугль-блоги.
4. Через пакет запросов, составленный на базе п.1-3, и выполненный  с объединением результатов поиска.
5. Один или несколько результатов, полученных на базе п.1-5,  наравне с другими объектами могут        участвовать в анализе на  пересечение ресурсов. Такой рекурсивный анализ объктов может быть  продолжен до бесконечности.

Данная функция называется в СайтСпутнике "Аналитическое объединение".
Краткое пояснение по ее применению.
1. Если у Вас установлен FileForFiles & SiteSputnik, то зайдите в
   "? | Наличие обновлений" и подкачайте новую версию,
   иначе скачайте дистрибутив с сайта программы.  
2. Создайте N новых запросов (далее буду назвать их в терминологии
   SiteSputnik условиями поиска - УП). На старых УП тестировать не рекомендую.
3. Создайте группу УП. Для этого, находясь в "Поиск в Интернете",
   зайдите в "Найти | Групповые операции | Манипулирование группами"
   или тоже самое сделайте из подменю иконки "Глобус с линзой".  
4. Запустите "Аналитическое объединение" на созданной группе УП
   из "Найти | Групповые операции" или "Глобуса с линзой".
   Группа УП - это именно та совокупность объектов, над которыми
   осуществляется аналитика.

   В результате Вы получите для N УП (объектов) матрицу пересечений УП,
таблицу пересечения для ссылок, таблицу пересечения для доменов,
подробное аналитическое объединение по группе УП, с указанием для каждой
ссылки, тех УП, которые ее нашли. Везде ссылки и домены упорядочены по
убыванию количества нашедших их УП.

   Пример изъятого из СайтСпутника аналитического объединения для группы
из четырех УП, тем или иным образом связанных с автором сообщения, приведен
здесь на следующих страницах.
Исследуемая группа УП - http://ab.vlink.ru/Example/Gro.htm
Матрица - http://ab.vlink.ru/Example/Mat.htm
Ссылки - http://ab.vlink.ru/Example/Ref.htm
Домены - http://ab.vlink.ru/Example/Dom.htm
Объединение - http://ab.vlink.ru/Example/Uni.htm
Характерно, что вверх "всплыл" именно тот сайт, на котором упомянуты или описаны все искомые объекты.

Сообщение отредактировал Alexei Mylnikov: 20 Март 2008 - 08:41


#18 Игорь Нежданов

Игорь Нежданов

    Прагматик

  • Users
  • 2 914 сообщений

Отправлено 21 Март 2008 - 08:08

Цитата(Alexei Mylnikov @ 20.3.2008, 11:31) <{POST_SNAPBACK}>
В сообщении #6 от 22.02.08 говорилось о функции,
...................
.ru/Example/Dom.htm"]http://ab.vlink.ru/Example/Dom.htm[/url]
Объединение - http://ab.vlink.ru/Example/Uni.htm
Характерно, что вверх "всплыл" именно тот сайт, на котором упомянуты или описаны все искомые объекты.


Уважаемый Alexei Mylnikov, а где можно по подробнее почитать про алгоритмы заложенные в проге? А то пробую - вроде работате, но что получил на выходе не совсем понимаю. Да и когда не понимаю как происходит обработка как то не уютно себя чувствую - нет доверия к результату.

#19 Alexei Mylnikov

Alexei Mylnikov

    Подозрительный тип

  • Members
  • 83 сообщений

Отправлено 21 Март 2008 - 09:31

Цитата(Иоанн @ 21.3.2008, 11:08) <{POST_SNAPBACK}>
Уважаемый Alexei Mylnikov, а где можно по подробнее почитать про алгоритмы заложенные в проге? А то пробую - вроде работате, но что получил на выходе не совсем понимаю. Да и когда не понимаю как происходит обработка как то не уютно себя чувствую - нет доверия к результату.


Уважаемый Иоанн, справку постараюсь сделать до 1 мая. Не делал ее потому, что интенсивно
разрабатывал программу. С вопросами можно обращаться ко мне или к MOSу (он давал
согласие на это), который пользуется SiteSputnik уже почти год и параллельно дает
ценные советы по его развитию.

По поводу доверия к результатам. Вся информация собирается высококлассными поисковиками -
Яндекс, Гугль, Яху, Рамблер ... Затем, если требуется аналитическая обработка,
например, на предмет пересечения Объекта1 с Объектом2 по количеству одинаковых ссылок,
то она производится СайтСпутник"ом, и даже если я опишу в справке алгоритмы работы программы,
то это Вам не поможет, так как могут быть ошибки в исходном коде, реализующим алгоритм,
и тогда придется сразу в справку вложить и исходный код программы. Поэтому правильность
работы программы можно устанавливать только опытным путем, что я и сам постояно делаю -
смотрю что спросил и анализирую, что мне СайтСпутник ответил. После нескольких подряд
удачных результатов тестирования, принимаю работу алгоритма и исполняемого кода как правильную.

#20 Игорь Нежданов

Игорь Нежданов

    Прагматик

  • Users
  • 2 914 сообщений

Отправлено 21 Март 2008 - 12:51

Цитата(Alexei Mylnikov @ 21.3.2008, 12:31) <{POST_SNAPBACK}>
...
По поводу доверия к результатам. Вся информация собирается высококлассными поисковиками -
Яндекс, Гугль, Яху, Рамблер ... Затем, если требуется аналитическая обработка,
например, на предмет пересечения Объекта1 с Объектом2 по количеству одинаковых ссылок,
то она производится СайтСпутник"ом, и даже если я опишу в справке алгоритмы работы программы,
то это Вам не поможет, так как могут быть ошибки в исходном коде, реализующим алгоритм,
и тогда придется сразу в справку вложить и исходный код программы. Поэтому правильность
работы программы можно устанавливать только опытным путем, что я и сам постояно делаю -
смотрю что спросил и анализирую, что мне СайтСпутник ответил. После нескольких подряд
удачных результатов тестирования, принимаю работу алгоритма и исполняемого кода как правильную.

Вот - вот. Саму то прогу пробую на зуб. Но не совсем понятно как проводится "аналитическая обработка на предмет пересечения". Если не сложно - поясните что это. Это простое упоминание указанных объектов на одном сайте или что то другое?


  • Страниц
  • 1
  • 2
  • 3
  • 4


Игры на androidSEO форум