john644 Опубликовано 20 октября, 2007 Поделиться Опубликовано 20 октября, 2007 Не надо в Эвеланш никакой качественной оценки. Почему-то многие забывают, что компьютер считать за человека может, а вот думать - нет. На примере того же ВААЛа скажу, что он настолько нелепо оценивает, скажем, иронию и сарказм в тексте, что потом приходилось вручную отсматривать тексты. Да и журналист в силу своего не слишком качественного образования или пробелов в воспитании может ляпнуть что-то случайно - а программка "беспристрастно" это оценит. И из неверной посылки сделает неверный вывод. Не надо такого. Впрочем, за все программы не скажу - не знаком. Просто своей головой как-то надежней работать. И качественная оценка содержания - это, извините, уже не рутина, а непосредственная работа профессионала в данной сфере. За которую некоторым еще и деньги неплохие платят. 34983[/snapback] Разработчик четко объяснил, что он понимает под эмоциональной оценкой. Программа не предусматривает оценку иронии и сарказма. Хотя конечно хотелось бы, но тогда аналитики были бы не нужны style_emoticons/default/smile14.gif Прочитайте ЛОГИКА ПРЕДИКАТОВ Я вам приведу только конец Так что "братания" языка логики с естественным языком не предвидится и в самой отдаленной перспективе, даже когда планета Земля начнет остывать Ссылка на комментарий Поделиться на другие сайты More sharing options...
mamoed Опубликовано 20 октября, 2007 Поделиться Опубликовано 20 октября, 2007 Из относительно недавних документов обработанных программой Vaal, было выступление одного политика. 15 страниц формата А4, шрифт Times, кегль 10 пунктов. Оценка, которую выдала программа, была очень близка к субъективной оценке фокус-группы после просмотра и прослушивания этого выступления "в живую" (не в записи, а именно при личном присутствии) и разбора стенограммы. Еще раз замечу - вначале была оценка людей, потом - обработка программой. 34989[/snapback] Ну так ВААЛ и предназначен для работы с подобными текстами. Если не ошибаюсь, даже на сайте разработчика говорится про это. А вот с разными по стилю и тематике документами возникают проблемы. У нас на одном компьютере эта программа установлена еще года три назад. И за все время работы с ней специалист выбрал для себя только одну функцию - подсчет и выделение ключевых слов. Иногда красивые графики для клиентов делаются... Все остальное - мозгом и ручками. Сразу отмечу: это специалист весьма высокого уровня. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Искендер Опубликовано 21 октября, 2007 Поделиться Опубликовано 21 октября, 2007 Ну так ВААЛ и предназначен для работы с подобными текстами. Если не ошибаюсь, даже на сайте разработчика говорится про это. А вот с разными по стилю и тематике документами возникают проблемы. У нас на одном компьютере эта программа установлена еще года три назад. И за все время работы с ней специалист выбрал для себя только одну функцию - подсчет и выделение ключевых слов. Иногда красивые графики для клиентов делаются... Все остальное - мозгом и ручками. Сразу отмечу: это специалист весьма высокого уровня. 35027[/snapback] Ну, так мозг и ручки никто не отменял, да и едва ли отменит. Только, вот, не всегда есть под рукой спец по фоносемантике. Особенно в полевых условиях. Ссылка на комментарий Поделиться на другие сайты More sharing options...
mamoed Опубликовано 23 октября, 2007 Поделиться Опубликовано 23 октября, 2007 Народ усиленно тестит Эвеланш ;-) Хоть бы отзывы писали, что ли? Ссылка на комментарий Поделиться на другие сайты More sharing options...
sten Опубликовано 29 октября, 2007 Поделиться Опубликовано 29 октября, 2007 К вопросу об эмоциональной окраске. Есть два взгляда на задачу. 1. (его исповедует и автор Аваланча). Мы можем посчитать частотку слов, построить профиль и соотнести его (профиль) с общей негативной или позитивной тональностью текста. Иными словами - сказать "текст злой" или "текст добрый" (утрирую несколько общности для) В лучшем случае - оцениваем автора статьи как злыдня. Ну, или общую тональность публикаций в этом источнике как негативную. 2. Выделяем объект оценки (физ/юр лицо) и смотрим опять же профиль, но применительно к объекту. Вот здесь интереснее - поскольку уже находимся в зоне анализа (Иванов плохо пишет про Сидорова, но хорошо про Петрова). Теперь переходим к инструменту. Можно идти по пути Медиалогии - рукопашной разметки текстов, в том числе и в части эмоциональной окраски. Плюс - прозрачная техника, понятно что и как. Минус - субъективизм и априори высокие и непроверяемые требования к эрудиции и подготовке оператора. Иной раз и проницательному аналитику иронию сложно подсечь. Когда же сидит оператор на потоке сообщений со средней школой за плечами... Другой путь - сродни пути ВААЛа или Метрика. А именно - автоматическое извлечение сущностей и соответствующих частей речи, отвечающих за передачу эмоций (наречия, прилагательные). И составление профиля исходя из такой информации. Из тех примеров, которые мне довелось видеть/трогать - точноть порядка 80%. И, понятное дело, хорошую литературу не подсекает:) Однако на массиве позволяет делать достаточно точные прогнозы: Латынина плохо относится к Путину и хорошо к Ходорковскому, а Хинштейн положительно относится к ФСБ/МВД и плохо к Березовскому. Реально вещь сильно зависящая от анализируемой выборки и почти всегда требует квалифицированной лингвистической подстройки. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Рекомендуемые сообщения
Заархивировано
Эта тема находится в архиве и закрыта для дальнейших ответов.