Перейти к содержанию

Аваланч - программа для мониторинга Интернета


Рекомендуемые сообщения

Не надо в Эвеланш никакой качественной оценки. Почему-то многие забывают, что компьютер считать за человека может, а вот думать - нет. На примере того же ВААЛа скажу, что он настолько нелепо оценивает, скажем, иронию и сарказм в тексте, что потом приходилось вручную отсматривать тексты. Да и журналист в силу своего не слишком качественного образования или пробелов в воспитании может ляпнуть что-то случайно - а программка "беспристрастно" это оценит. И из неверной посылки сделает неверный вывод. Не надо такого.

 

Впрочем, за все программы не скажу - не знаком. Просто своей головой как-то надежней работать. И качественная оценка содержания - это, извините, уже не рутина, а непосредственная работа профессионала в данной сфере. За которую некоторым еще и деньги неплохие платят.

34983[/snapback]

Разработчик четко объяснил, что он понимает под эмоциональной оценкой.

Программа не предусматривает оценку иронии и сарказма. Хотя конечно хотелось бы, но тогда аналитики были бы не нужны style_emoticons/default/smile14.gif

Прочитайте ЛОГИКА ПРЕДИКАТОВ

Я вам приведу только конец

Так что "братания" языка логики с  естественным  языком не  предвидится  и  в  самой  отдаленной  перспективе, даже когда планета Земля начнет остывать
Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 389
  • Создана
  • Последний ответ
Из относительно недавних документов обработанных программой Vaal, было выступление одного политика. 15 страниц формата А4, шрифт Times, кегль 10 пунктов. Оценка, которую выдала программа, была очень близка к субъективной оценке фокус-группы после просмотра и прослушивания этого выступления "в живую" (не в записи, а именно при личном присутствии) и разбора стенограммы. Еще раз замечу - вначале была оценка людей, потом - обработка программой.

34989[/snapback]

 

Ну так ВААЛ и предназначен для работы с подобными текстами. Если не ошибаюсь, даже на сайте разработчика говорится про это. А вот с разными по стилю и тематике документами возникают проблемы. У нас на одном компьютере эта программа установлена еще года три назад. И за все время работы с ней специалист выбрал для себя только одну функцию - подсчет и выделение ключевых слов. Иногда красивые графики для клиентов делаются... Все остальное - мозгом и ручками. Сразу отмечу: это специалист весьма высокого уровня.

Ссылка на комментарий
Поделиться на другие сайты

Ну так ВААЛ и предназначен для работы с подобными текстами. Если не ошибаюсь, даже на сайте разработчика говорится про это. А вот с разными по стилю и тематике документами возникают проблемы. У нас на одном компьютере эта программа установлена еще года три назад. И за все время работы с ней специалист выбрал для себя только одну функцию - подсчет и выделение ключевых слов. Иногда красивые графики для клиентов делаются... Все остальное - мозгом и ручками. Сразу отмечу: это специалист весьма высокого уровня.

35027[/snapback]

 

Ну, так мозг и ручки никто не отменял, да и едва ли отменит. Только, вот, не всегда есть под рукой спец по фоносемантике. Особенно в полевых условиях.

Ссылка на комментарий
Поделиться на другие сайты

К вопросу об эмоциональной окраске.

 

Есть два взгляда на задачу.

 

1. (его исповедует и автор Аваланча). Мы можем посчитать частотку слов, построить профиль и соотнести его (профиль) с общей негативной или позитивной тональностью текста.

Иными словами - сказать "текст злой" или "текст добрый" (утрирую несколько общности для)

В лучшем случае - оцениваем автора статьи как злыдня.

Ну, или общую тональность публикаций в этом источнике как негативную.

 

2. Выделяем объект оценки (физ/юр лицо) и смотрим опять же профиль, но применительно к объекту.

Вот здесь интереснее - поскольку уже находимся в зоне анализа (Иванов плохо пишет про Сидорова, но хорошо про Петрова).

 

Теперь переходим к инструменту.

Можно идти по пути Медиалогии - рукопашной разметки текстов, в том числе и в части эмоциональной окраски.

Плюс - прозрачная техника, понятно что и как.

Минус - субъективизм и априори высокие и непроверяемые требования к эрудиции и подготовке оператора.

 

Иной раз и проницательному аналитику иронию сложно подсечь.

Когда же сидит оператор на потоке сообщений со средней школой за плечами...

 

Другой путь - сродни пути ВААЛа или Метрика.

А именно - автоматическое извлечение сущностей и соответствующих частей речи, отвечающих за передачу эмоций (наречия, прилагательные).

И составление профиля исходя из такой информации.

 

Из тех примеров, которые мне довелось видеть/трогать - точноть порядка 80%.

 

И, понятное дело, хорошую литературу не подсекает:)

Однако на массиве позволяет делать достаточно точные прогнозы:

Латынина плохо относится к Путину и хорошо к Ходорковскому, а Хинштейн положительно относится к ФСБ/МВД и плохо к Березовскому.

 

Реально вещь сильно зависящая от анализируемой выборки и почти всегда требует квалифицированной лингвистической подстройки.

 

 

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...