Перейти к содержанию

Автоматическое выделение ключевых слов в тексте


Рекомендуемые сообщения

Здравствуйте!

 

В повседневной работе с большим количеством информации постоянно сталкиваюсь с такой проблемой: необходимо выделять значительное количество ключевых слов и словосочетаний в документах Word. Пока что делаю это вручную - через пункт меню "Заменить". Но это весьма трудоемкий процесс, когда размер документа большой, ключевых слов несколько, и для каждого из них нужно задать словоформы. После этого необходимо еще и подсчитать частоту упоминания этих слов... Адский труд, море убитого времени...

 

Что нужно в идеале:

Программа/макрос, которые будут это делать автоматически. То есть, забиваешь в них все ключевые слова/сочетания, жмешь кнопку - и в документе слова автоматически выделяются (желательно - разным цветом для разных слов), а в отчете приводится статистика частоты упоминания.

 

В макросах я полный профан: даже не знаю, реально ли это реализовать.

Может, посоветуете что-нибудь?

 

Заранее благодарен.

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 24
  • Создана
  • Последний ответ
Здравствуйте!

 

В повседневной работе с большим количеством информации постоянно сталкиваюсь с такой проблемой: необходимо выделять значительное количество ключевых слов и словосочетаний в документах Word. Пока что делаю это вручную - через пункт меню "Заменить". Но это весьма трудоемкий процесс, когда размер документа большой, ключевых слов несколько, и для каждого из них нужно задать словоформы. После этого необходимо еще и подсчитать частоту упоминания этих слов... Адский труд, море убитого времени...

 

Что нужно в идеале:

Программа/макрос, которые будут это делать автоматически. То есть, забиваешь в них все ключевые слова/сочетания, жмешь кнопку - и в документе слова автоматически выделяются (желательно - разным цветом для разных слов), а в отчете приводится статистика частоты упоминания.

 

В макросах я полный профан: даже не знаю, реально ли это реализовать.

Может, посоветуете что-нибудь?

 

Заранее благодарен.

11725[/snapback]

Если никто лучше не подскажет, могу такие решения.

 

Вариант 1 Самый простой.

Поставьте на компьютер бесплатную программу Copernic Desktop с сайта http://www.copernic.com/

Он индексирует документы. Затем введите ключевое слово. Документ, содержащий его, появится во встроенном браузере Коперника, причем слова будут подчеркнуты. Теперь просто скопируйте его из встроенного браузера в обычный пустой вордовский документ - и подчеркивание останется. Только что попробовал - нормально получается.

 

 

Вариант 2 Возможно, тоже несложный, но надо советоваться.

У компьютеров Apple есть такая встроенная программа Автоматор. Он любую последовательность действий может автоматизировать. И Ворд MacOS понимает вполне нормально. Поговорите с представительством Apple или задайте вопрос на форуме http://www.deepapple.com/forum/ можно ли автоматизировать с помощью автоматора подчеркивание слов.

 

Ну если кто-то даст готовый рецепт, я бы тоже с интересом на него посмотрел.

Ссылка на комментарий
Поделиться на другие сайты

Поставленная задача по выделению ключевых слов- из раздела контент-анализа.

На сайте www.analyst.ru есть урезанная бесплатная прога textanalyst 2.0

 

Для скачивания можно нажать здесь:

http://www.analyst.ru/cgi-bin/stat/loadfile.pl?file=ta_eng

 

И самое главное, есть возможность редактирования словаря.

 

Есть конечно некоторые ограничения для работы (все-таки бесплатная), но жить можно.

 

Ссылка на комментарий
Поделиться на другие сайты

Все это делаеться элементарно просто на Языке VBA ( макросы) но будет проблема с выделением разных форм слова, если это нужно. Проще попросить знакомого програмиста он это сделает за пол часа. Нужно только грамотно паставить Тех. задание програмисту .

Ссылка на комментарий
Поделиться на другие сайты

Побольше получаса style_emoticons/default/smile10.gif, но это на мой взгляд оптимальный вариант. Скорее всего надо писать не просто макрос а настройку AddIns. Так что ищите знакомого программиста. style_emoticons/default/smile3.gif

Ссылка на комментарий
Поделиться на другие сайты

Занимаюсь индексированием и всяким поиском. Основная проблема на мой взгляд заключается в отслеживании словоизменений. Для этого необходимо использовать какую-нибудь парадигматическую словобразовательную базу языка, на котором написан текст. А также существенный момент в поиске и замене словосочетаний... короче могу написать прогу...

Ссылка на комментарий
Поделиться на другие сайты

Аналогичные функции, кстати, есть в системе ВААЛ. Но покупать ее только из-за этого - нелепо, а остальные ее функции нам не нужны. Так что если кто сможет взяться за решение этой задачи, пишите: mamoed@mail.ru.

Ссылка на комментарий
Поделиться на другие сайты

Основная проблема на мой взгляд заключается в отслеживании словоизменений.

12068[/snapback]

Вот тут как раз Коперник Десктоп может быть полезен. Надо просто ввести слово не полностью.

Ссылка на комментарий
Поделиться на другие сайты

Вот тут как раз Коперник Десктоп может быть полезен. Надо просто ввести слово не полностью.

12177[/snapback]

А что со словами, изменительная парадигма которых такова, что слово в различных формах пишется совершенно по-разному: "він-його", "йти-йдуть"...

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...