Перейти к содержанию

it2b Wiki: Где и как в интернете искать информацию о компании


Рекомендуемые сообщения

  • 3 недели спустя...

Уважаемый Иоанн,

хотел бы подробнее узнать о Ваших наработках извлечения информации из чатов. Начиная с их отбора по конкретной разработке, и заканчивая контент-анализом потока.

Ссылка на комментарий
Поделиться на другие сайты

Уважаемый Иоанн,

хотел бы подробнее узнать о Ваших наработках извлечения информации из чатов. Начиная с их отбора по конкретной разработке, и заканчивая контент-анализом потока.

 

MOS, не знаю, как работал Иоан, могу конкретный пример привести.

Требовалось установить источник... ну скажем так, небольшой утечки.

Анализировались ник, на который была ссылка в публикации. Искались публикации с аналогичными никами (посты в форумы и блоги). Просматривался контент - с целью выделить ники, принадлежащие одному человеку. Ручками, без автоматизации. В основном в форумах и на ЖЖ.

Оттуда прямая дорожка в чаты, которыми пользовался фигурант.

Там - смотрим контент, понимаем, тот или не тот. Пусть не со стопроцентной вероятностью. Но чем больше постов, тем выше вероятность определения. Заодно смотрим, не развивается ли тема по утечке.

Заодно на прокси смотрим, с каких внутренних IP есть соединение с данными ресурсами в данное время. И куда еще человечек ходит в рабочее время...

Собственно, получаем результат.

Но это, в общем, частный случай.

Честно говоря, на работу в чате время жалко, и по форумам/блогам/прочему достаточно информации получить можно.

 

 

 

Ссылка на комментарий
Поделиться на другие сайты

Lang

 

Ручками, без автоматизации.

Честно говоря, на работу в чате время жалко, и по форумам/блогам/прочему достаточно информации получить можно.

 

Если ручками, то конечно, никаких человеко-часов не напасешься. Но вот с достатком информации не соглашусь. Реквизиты, некоторые имена и другие постоянные данные извлечь можно и не используя чаты. Но формат блогов - это все же публикация. Формат форумов - открытая переписка. А чаты - "живое" общение в реальном времени. Необходимость быстро отвечать собеседникам и поддерживать диалог в чатах способствуют не только повышенной болтливости, но и детализации выбалтываемых чатером сведений. Отличная среда получения оперативной информации.

 

Но соглашусь, что есть свои серьезные проблемы, такие как идентификация чатеров и качество извлекаемого материала, когда высокая полнота-оперативность компенсируются низкой достоверностью-объективностью. Большие проблемы с ценностью и возрастом чатеров. Еще можно рассчитывать на информацию от менеджеров, секретарей и членов их семей. Но вероятность обнаружения в чате важных источников стремится к нулю.

Решения все сложные. И как понимаю, мало кто обрабатывает или мониторит чаты.

 

Относительно автоматизации - не так все сложно. Используйте любой кейлоггер, способный снимать текст экрана по таймеру и по ключевым словам.

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...

Мониторить чаты хорошо, если точно знаешь, что твои объекты там сидят. Хуже, когда источник приходится искать фиг знает где, при этом совпадений почти полных тоже немеряно... Люди то одинаковые, иногда вплоть до выбора ников и распространяемой информации (сюжетов то в офисной жизни да и в жизни вообще не так уж много) Аж страшно становится....

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.

×
×
  • Создать...