Перейти к содержанию

Инфопризма 2010


Рекомендуемые сообщения

http://82.193.140.11/hb/hb_search2.php?page=4

 

Тестируется новая система сбора данных с БД с дальнейшим анализом англоязычных научных баз данных и англоязычных библиотек печатных источников. Возможно, участникам форума это будет интересно.

 

В основнои? версии, открытого доступа к системе - это возможность получить данные из более 3 десятков СУБД по англоязычным открытым, печатным источникам общим количеством документов более 100 миллионов документов.

 

Система имеет веб доступ и встроенную оценку эмоциональнои? окраски, определения субъективнои? оценки в текстах и извлечение данных из англоязычных, в том числе научных библиотек и баз данных.

 

Построена на Linux и предназначена для использования маркетологов, владельцев среднего и крупного бизнеса работающих в сфере ВЭД, пиар-специалистов, журналистов, для конкуретной разведки, бизнес разведки, анализа конкурентов.

 

Первоначально продукт был заказан и разрабатывался для частных инвесторов, однако в ходе работы над проектом, нашим коллективом было принято решение использовать его в демо доступе. Особенность программы, - в открытом, онлайн и веб-доступе, также возможности провести мгновенную оценку, практически любого рода анализ над полученными из библиотек данных. В системе имеется уникальный модуль извлечения данных из новостей - вы можете узнать кто ваши конкуренты, чем они заняты, насколько стратегия их развития на медиа поле эффективна. Система позволяет извлечь имена, названия компаний и продуктов в какой то определенной области. Самое главное, - система позволяет сначала скачать данные, провести их анализ и потом, при необходимости передать по протоколу XML в другие программы для анализа.

 

В систему открыт доступ для университетов и любых других, российских научных учреждений и частных лиц.

 

Система позволяет делать следующее:

 

* Доступ к базе из более 80 миллионов документов(+печатные новости, журналы, статьи)

* Проводить их аналитику в онлаи?н режиме

* Оценивать эмоциональную окраски текста

* Определять тексты с субъективнои? позициеи?

* Извлечение объектов(имена, названия компании?)

* выделения из текстов географических названии?.

* выделению из массива текстов любых необходимых данных по заданному словарю

* Создавать эссе статьи или всего массива от 10 до 100% от заданного текста

* Определять ключевые слова текста

* Преобразовывать текст в XML формат

* Пользователь может создавать свои словари фильтры, условия поиска, словари

По желанию возможно ввести дополнительные модули, находящиеся в тестировании:

* последующий анализ взаимосвязи объектов по временнои? и другим шкалам.

 

 

 

Система тестируется, словари пока не полнофункциональны.

 

 

Леонид Гав, lab767@gmail.com

Руководитель лаборатории разработчиков,

НПО "Лаборатория К"

Ссылка на комментарий
Поделиться на другие сайты

  • 2 года спустя...
  • 2 месяца спустя...
  • 7 лет спустя...

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.

×
×
  • Создать...