Перейти к содержанию

Нетекстовый поиск информации в Интернете


Рекомендуемые сообщения

Искендер

На самом деле, здесь поможет как раз текстовый поиск информации. Имея оригиналы тестов объекта, несложно выявить характерные для пользователя фразеологические обороты, манеру письма, используемый словарный запас и в некоторых случаях часто встречающиеся опечатки и ошибки. Фразеологические обороты, опечатки и кое-что из манеры письма (регистр, спецсимволы и т.д.) можно задать поисковикам, чтобы отобрать ресурсы, где это встречается. Кроме этого, проиндексировать тематические ресурсы, соответствующие области интересов объекта, и осуществить поиск по характерным особенностям написания через текстовые редакторы, типа TextPipe, а затем сравнить словарный запас с имеющимся. Можно той же программой. Сюда же добавим характерный для объекта объем разового поста, переносы строк, индивидуальные психологические и этические окраски. Не так уж сложно, но муторно, конечно.

Впрочем, на форуме не одна яркая в этом плане личность, чьи посты на других ресурсах я читал с большим интересом.

 

Есть паммгорра, каоторя поомгает бртоьсоя с псаииококвми, в нкыреотох сяулачх. Сеачйс Вы чеиатте фарнгмет, оарныанотббй тоакй праоммрогй.

 

Ее написал Кирилл Харламов. WordTrick 1.0, и как видите, она просто мешает буквы в словах, что почти не мешает воспринимать при чтении все слово.

 

Кроме того, можно воспользоваться программами транслитерации, которые создают дополнительные трудности поиска. А также программами, которые превращают текст в изображение, которое, как здесь выяснилось, поисковики не способны ни адекватно индексировать, ни распознавать в качестве текста. Одна из программ, объединяющих обе эти функции - Алфавит.

 

Обе программы чуть позже залью в ветку оперативных программ - как водится, не требуют инсталляции и малы по объему.

 

 

А вот вопрос скрытого IP - актуальный. Кажется, гораздо легче выявить адрес IP, чем мониторить его крытым. Так же актуальна автоматизация мониторинга. Совершенно изматывающее занятие для любого человека!

 

Банальный пример - аська.

Хороша тем уже, что по умолчанию устанавливает автозапуск. Поэтому у многих пользователей выход в Интернет соответствует входу ICQ. Но тут же проблема - чтобы мониторить в реальном времени, необходима авторизация, и чтобы пользователь не скрывал себя настройками. Если этого нет - включил на любой машине автоскриншот с регулярностью в минуту, или подходящий логгер - и свободен. Потом по цвету епестков и датам скринов фиксируешь характерное время пребывания пользователя в сети, чтобы сопоставить с другими данными. А если он скрылся настройками?

 

Логично идти просто на сайт ICQ, и если при регистрации пользователь не отказался от публикации в каталоге, по цвету его лепестков определяем активность. Но для мониторинга приходится производить постоянную перезагрузку страницы. Это же бред!

 

Что уж говорить о форумах и чатах... Ну, форумы - пол-беды. Большинство дают хоть какую-то информацию о последнем визите под именем. (под именем!). А чаты? Еще если учитывать, что в них надо регистрироваться, а при бездействии многие просто выкидывают.

 

И как организовать одновременную работу по известным параметрам на одной машине? Может, есть какая-то программа "карусельной" загрузки определенных окон и адресов?

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 26
  • Создана
  • Последний ответ
Искендер

На самом деле, здесь поможет как раз текстовый поиск информации.

21798[/snapback]

 

Ну, не буду цепляться к тому, что речь в ветке о "Нетекстовом поиске". :-)

 

Остальное сказанное Вами комментировать и оспаривать не стану. Я не настолько плотно этой темой занимался, не настолько глубоко владею технологиями и инструментарием. Однако, то, что Вы описываете и к чему хотите в итоге придти кажется мне, все же, маловероятным, уж простите. Хотя бы, с точки зрения требуемых на такой глобальный мониторинг по всей Сети, аппаратных мощностей. Возможно, что я и не прав.

 

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...
  • 1 месяц спустя...

В тему "нетекствого поиска информации". Наткнулся тут на интересный поисковик. Ищет не слова (символы , буквы и их сочетание), а изображения. Поиск ведется по аналогии и по описанию. Пробуйте http://www.riya.com/ я пока ничего конкретного сказать не могу.

 

Уже дополнение. Ищет это буржуйское детище только по описанию на буржуйском языке.

Ссылка на комментарий
Поделиться на другие сайты

по поводу изображений: сталкивался с этим, наилучших для той задачи результатов добился во-первых, в гугле (нахожу сайт где есть хотя бы одно интересующее меня изображение и говорю гуглу найти все изображения на этом сервенре.), через свойства файла (правой кнопкой мыши на изображение - свойства - и смотреть на адрес, где картинка лежит. иногда можно прибавить единичку к номеру файла, иногда даже попасть в папку со всеми изображениями). очень помогла работа с поисковыми системами на других языках (финский www.loyda.fi, венгерский www.keres.hu). ну, и подбор ключевых слов и ресурсов..

 

где-то видел систему поиска по большим фотосайтам, где можно задавать тип камеры и что-то еще. могу предположить, что на многих сайтах типа девиантарта такое может быть реализовано.

 

а вот что касается поиска по свойствам самого файла - насчет изображенгий не слышал, а вот насчет аудиофайлов - вроде бы ест ьпрограмма, позволяющая искать через сеть аудио-файл с определенными параметрами звука, итд... если интересно, спрошу подробнее, а то пока только обрывки одной беседы вспоминаются...

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...