MOS Опубликовано 20 марта, 2007 Автор Поделиться Опубликовано 20 марта, 2007 Искендер На самом деле, здесь поможет как раз текстовый поиск информации. Имея оригиналы тестов объекта, несложно выявить характерные для пользователя фразеологические обороты, манеру письма, используемый словарный запас и в некоторых случаях часто встречающиеся опечатки и ошибки. Фразеологические обороты, опечатки и кое-что из манеры письма (регистр, спецсимволы и т.д.) можно задать поисковикам, чтобы отобрать ресурсы, где это встречается. Кроме этого, проиндексировать тематические ресурсы, соответствующие области интересов объекта, и осуществить поиск по характерным особенностям написания через текстовые редакторы, типа TextPipe, а затем сравнить словарный запас с имеющимся. Можно той же программой. Сюда же добавим характерный для объекта объем разового поста, переносы строк, индивидуальные психологические и этические окраски. Не так уж сложно, но муторно, конечно. Впрочем, на форуме не одна яркая в этом плане личность, чьи посты на других ресурсах я читал с большим интересом. Есть паммгорра, каоторя поомгает бртоьсоя с псаииококвми, в нкыреотох сяулачх. Сеачйс Вы чеиатте фарнгмет, оарныанотббй тоакй праоммрогй. Ее написал Кирилл Харламов. WordTrick 1.0, и как видите, она просто мешает буквы в словах, что почти не мешает воспринимать при чтении все слово. Кроме того, можно воспользоваться программами транслитерации, которые создают дополнительные трудности поиска. А также программами, которые превращают текст в изображение, которое, как здесь выяснилось, поисковики не способны ни адекватно индексировать, ни распознавать в качестве текста. Одна из программ, объединяющих обе эти функции - Алфавит. Обе программы чуть позже залью в ветку оперативных программ - как водится, не требуют инсталляции и малы по объему. А вот вопрос скрытого IP - актуальный. Кажется, гораздо легче выявить адрес IP, чем мониторить его крытым. Так же актуальна автоматизация мониторинга. Совершенно изматывающее занятие для любого человека! Банальный пример - аська. Хороша тем уже, что по умолчанию устанавливает автозапуск. Поэтому у многих пользователей выход в Интернет соответствует входу ICQ. Но тут же проблема - чтобы мониторить в реальном времени, необходима авторизация, и чтобы пользователь не скрывал себя настройками. Если этого нет - включил на любой машине автоскриншот с регулярностью в минуту, или подходящий логгер - и свободен. Потом по цвету епестков и датам скринов фиксируешь характерное время пребывания пользователя в сети, чтобы сопоставить с другими данными. А если он скрылся настройками? Логично идти просто на сайт ICQ, и если при регистрации пользователь не отказался от публикации в каталоге, по цвету его лепестков определяем активность. Но для мониторинга приходится производить постоянную перезагрузку страницы. Это же бред! Что уж говорить о форумах и чатах... Ну, форумы - пол-беды. Большинство дают хоть какую-то информацию о последнем визите под именем. (под именем!). А чаты? Еще если учитывать, что в них надо регистрироваться, а при бездействии многие просто выкидывают. И как организовать одновременную работу по известным параметрам на одной машине? Может, есть какая-то программа "карусельной" загрузки определенных окон и адресов? Ссылка на комментарий Поделиться на другие сайты More sharing options...
Искендер Опубликовано 20 марта, 2007 Поделиться Опубликовано 20 марта, 2007 Искендер На самом деле, здесь поможет как раз текстовый поиск информации. 21798[/snapback] Ну, не буду цепляться к тому, что речь в ветке о "Нетекстовом поиске". :-) Остальное сказанное Вами комментировать и оспаривать не стану. Я не настолько плотно этой темой занимался, не настолько глубоко владею технологиями и инструментарием. Однако, то, что Вы описываете и к чему хотите в итоге придти кажется мне, все же, маловероятным, уж простите. Хотя бы, с точки зрения требуемых на такой глобальный мониторинг по всей Сети, аппаратных мощностей. Возможно, что я и не прав. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Проктолог Опубликовано 2 апреля, 2007 Поделиться Опубликовано 2 апреля, 2007 Del Ссылка на комментарий Поделиться на другие сайты More sharing options...
Игорь Нежданов Опубликовано 27 мая, 2007 Поделиться Опубликовано 27 мая, 2007 В тему "нетекствого поиска информации". Наткнулся тут на интересный поисковик. Ищет не слова (символы , буквы и их сочетание), а изображения. Поиск ведется по аналогии и по описанию. Пробуйте http://www.riya.com/ я пока ничего конкретного сказать не могу. Уже дополнение. Ищет это буржуйское детище только по описанию на буржуйском языке. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Hazaroff Опубликовано 29 мая, 2007 Поделиться Опубликовано 29 мая, 2007 по поводу изображений: сталкивался с этим, наилучших для той задачи результатов добился во-первых, в гугле (нахожу сайт где есть хотя бы одно интересующее меня изображение и говорю гуглу найти все изображения на этом сервенре.), через свойства файла (правой кнопкой мыши на изображение - свойства - и смотреть на адрес, где картинка лежит. иногда можно прибавить единичку к номеру файла, иногда даже попасть в папку со всеми изображениями). очень помогла работа с поисковыми системами на других языках (финский www.loyda.fi, венгерский www.keres.hu). ну, и подбор ключевых слов и ресурсов.. где-то видел систему поиска по большим фотосайтам, где можно задавать тип камеры и что-то еще. могу предположить, что на многих сайтах типа девиантарта такое может быть реализовано. а вот что касается поиска по свойствам самого файла - насчет изображенгий не слышал, а вот насчет аудиофайлов - вроде бы ест ьпрограмма, позволяющая искать через сеть аудио-файл с определенными параметрами звука, итд... если интересно, спрошу подробнее, а то пока только обрывки одной беседы вспоминаются... Ссылка на комментарий Поделиться на другие сайты More sharing options...
Рекомендуемые сообщения
Заархивировано
Эта тема находится в архиве и закрыта для дальнейших ответов.