Игорь Нежданов Опубликовано 6 декабря, 2004 Поделиться Опубликовано 6 декабря, 2004 А это уже агентурная работа и работа со слухами. Тоже крайне интересное и неоднозначное направление деятельности. Предлагаю на суд сообщества технологию первичного изучения сообщений СМИ: 1 Установление источника, получателя, их пространственных и временных координат.Если этого нельзя прямо установить из содержания текста, то используются следующие приемы:– для установления источника:определение специфики лексикона источника - анализ распределения служебных терминов - определение частоты употребления слов и сопоставление с аналогичными показателями известных источников + сопоставление с аналогичными характеристиками профессиональных, социальных, этнических и т.п. групп.Ценный результат дает сопоставление стат анализа с:- профессиональными эталонами - для определения проф принадлежности- образовательными эталонами – для установления уровня образования- авторскими эталонами (статьи СМИ) – для определения авторства, для определения того, что статья писалась под диктовку, для определения подложного авторства - для установления временного интервала:исследуются все имеющиеся в сообщении указания на его принадлежность к некоторому временному интервалу, отраженному в ссылках на те события, даты которых известны или могут быть установлены. - для установления получателя:кому может быть интересна данная информация, кто читает данный источник (если это СМИ) и т.д. 2 Установление фактической составляющей текста, его тематики.В начале из текста выделяют:- компоненты, которые могут быть отнесены к разряду фактов (например подтверждены иными источниками)- компоненты, которые потенциально могут быть отнесены к разряду фактов- компоненты, которые не могут быть отнесены к разряду фактовДалее определяется каким образом можно подтвердить или опровергнуть потенциальные факты. При этом нельзя забывать об искажениях, вносимых в текст:- непреднамеренные логические ошибки;- некорректное построение грамматических конструкций;- преднамеренное искажение;- эмоциональные искажения.Поэтому важно выявить в тесте наличие причинно-следственных связей. 3 Анализ полноты и непротиворечивости обоснований.Вначале текст нужно привести в формализованный вид. Иными словами его нужно пересказать сухим языком, удалив любые образования и надстройки (эмоциональные, психологические, рекламно-пропагандистские, ненормативная лексика, слэнг и т.п.). Далее аргументы выстраиваются в соответствии с правилами логики и выявляются искажения (отсутствие аргументации, ложная аргументация, неполная аргументация и т.п.) 4 Установление эмоциональной составляющей текста и системы оценок.Текст анализируется на наличие слов, терминов, словообразований способных воздействовать на эмоциональное состояние потребителя сообщения. Это позволяет, в сочетании с анализом специфики лексики источника, выявить систему ценностей источника и определить поведенческие особенности этого источника. Второй составляющей данного этапа является фильтрация оценочных суждений источника. 5 Установление цели создания текста.Донный этап возможен если установлен потребитель текста. Тогда анализируется его модель окружающего мира и сравнивается с предлагаемой моделью в тексте сообщения. Если модели совпадают или отличаются незначительно – обычное общение. Если модели различаются значительно – источник преследует цель побуждения потребителя к неким действиям. Если в модели окружающего мира потребителя никак не отражена описываемая источником область (потребитель ничего не знает об этом) – налицо формирование модели (представления), а вот с какой целью – следующий вопрос. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Lang Опубликовано 10 декабря, 2004 Поделиться Опубликовано 10 декабря, 2004 Если подойти чуть по другому... Точнее, чуть с другой стороны посмотреть. 1. Получаем сведения (данные).Т.е. саму исходную информацию (статью в СМИ), заносим ее в базу. 2. Получаем мета-данные (характеристики источника, стока, канала, параметры времени и т.п.) 3. Превращаем сведения в информацию (сведения + мета-данные, с учетом уже имеющейся информации) 4. Анализируем информацию (внутренняя непротиворечивность, фактическая непротиворечивость, ангажированность источника, стиль, эмоциональная окраска и т.п.), проводим анализ по перекрестным ссылкам, превращаем информацию в "знания". 5. Анализируем информацию по другим областям "знания", ищем и анализируем корреляции, анализируем динамику, контекст, структурируем для получения "intelligince" - структурированной информации/знаний, досточных для прогностки и выработки решений Ссылка на комментарий Поделиться на другие сайты More sharing options...
Игорь Нежданов Опубликовано 10 декабря, 2004 Поделиться Опубликовано 10 декабря, 2004 Для Lang: Да, алгоритм анализа сообщения такой. Но при условии достаточных сил и средств + небольшой поток данных. Задача многократно усложняется при поступлении большого колличества сообщений. В этом случае нужно либо автоматизировать процесс, либо увеличивать штат, либо принудительно сокращать поток, либо не выполнять часть шагов процедуры. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Рекомендуемые сообщения
Заархивировано
Эта тема находится в архиве и закрыта для дальнейших ответов.