Перейти к содержанию

Медбрат

Members
  • Публикаций

    15
  • Зарегистрирован

  • Посещение

Репутация

0 Обычный

Информация о Медбрат

  • Звание
    Подозрительный тип
  1. Спасибо за информацию :smile5: 2Lang Нет, не реклама. Я действительно не исключал возможности существования аналогичной системы с похожим названием. Теперь вопрос снят :smile5:
  2. Может кто подскажет, как правильно называется программа/система автоматизированного сбора текстовой информации из интернета и дальнейшей ее интеллектуальной обработки (text mining) в локальной сети? Ассоциативно помню только что-то вроде "айкумен" или "iqmen". В общем ситуация у меня типа "могу ли я -> хочу ли я -> ... ли я -> магнолия" :smile2: Коллеги, выручайте, плиз.
  3. А что значит "из поискового индекса страницу удалили, а в кеше она еще осталась"? Я думал, что кэш и индекс - это одно и то же :smile13:
  4. Через расширенный поиск смотрел - результат тот же. Искомое слово Y - это nickname, состоящий только из латинских букв. Кстати, содержимое страницы, на которую ведёт рассматриваемая ссылка, уже месяц как удалено, а у Гугла в базе лежит именно "фотография" этой страницы двухмесячной давности.
  5. Ввожу поисковый запрос, состоящий из одного слова Y. Google выдаёт 3 страницы ссылок, но той которая меня интересует, среди них нет. Хотя я знаю, что она существует и ведёт на сайт X. Ввожу запрос по-другому site:X Y Google показывает мне упомянутую ссылку. Какое этому есть объяснение?
  6. Через whois удалось выйти на админов. Спасибо за подсказку :smile5:
  7. Давал объявление на одном сайте в интернете. Потом его оттуда удалил, но между делом моя объява каким-то образом без моего ведома попала с этого сайта ещё на 2 других сайта аналогичной тематики. Интерфейс для удаления объявлений на этих 2 сайтах есть, но поскольку я там самостоятельно ничего не размещал, то и удалить ничего сам не могу, так как не знаю логина/пароля. Админы при этом ни на письма, ни на телефонные звонки в течение уже 2 месяцев не отвечают. Подскажите, как всё-таки можно эти объявы хакернуть? Висят они там до сих пор очень некстати :( На каких ещё форумах в инете могут о
  8. А более продвинутый анализ текста для выявления дубликатов, хотя бы на уровне отличия фрагментов на несколько словосочетаний или предложений какая-нибудь софтина делает? На практике такое отличие часто встречается, когда одна и та же новость печатается в разных источниках.
  9. to Yury Прикрутили к нашей БД утилиту полнотекстового поиска. Находим с помощью неё по ключевым словам то, что нас интересует. Далее анализируем глазами. Объёмы пока что позволяют. Какую-либо профессиональную систему пока не готов руководству предлагать. Не подскажете, а насколько адекватно работет удаление дублирующих друг друга фрагментов текста в Cros?
  10. Коллеги, хочу расширить тему обсуждения. В настоящий момент мы часть информации достаём из Интегрума по ключевым словам, а часть- из новостных рассылок. Каждая заметка из прессы складывается в отдельный файл на диске. При этом зачастую наблюдается дублирование информации. Подскажите, как можно автоматизировать удаление файлов-дубликатов?
  11. Благодарю за инфу :-) 1. Если я не ошибаюсь, то ВПС- это www.wps.ru? Но они, судя по информации на их сайте, являются аналогом Центра управления знаниями, а не Интегрума. Или они тоже предоставляют платный доступ к своей БД прессы наряду с Интегрумом, Пабликом и Медиалогией? 2. Относительно GetNews. Выигривает ли по своим функциональным возможностям GetNews 1.41 в сравнении с другими агрегаторами новостей: FeedDemon 1.5 ActiveRefresh 2.5.3 NewsPiper 3.3.15 Abilon 2.5.3 A4news 1.0 mDigger (бывший Mobilizer)? Почему Вы именно его упомянули? И самое главное, гд
  12. Коллеги, а кто-нибудь может меня просветить, чем пользуется компания "Центр управления знаниями" ("Михайлов и партнёры") для подготовки ежедневных обзоров прессы? Судя по всему, это Интегрум и/или Фактива. Или же ещё используются какие-то RSS-агрегаторы? Как они добиваются такой оперативности в подготовке больших объёмов свежей текстовой информации?
  13. CronosPlus версии 3.01.20. При помощи простого запроса (F3) делаю из банка данных выборку 1,3 млн строк из 11 млн имеющихся в этом БД. Затем пытаюсь сделать выдачу отобранных строк в текстовый файл при помощи спроектированной мной выходной формы. Текст формы приведён ниже: @o1:=""; @o2:=""; @o3:=""; @o4:=""; cat(t21_УЧ,@o1:=УЧ2); cat(t22_УЧ,@o2:=УЧ2); cat(t23_УЧ,@o3:=УЧ2); cat(t24_УЧ,@o4:=УЧ2); @a:=@SYSNOMER<<"*-*-*"<<@o1<<"*-*-*"<<@o2<<"*-*-*"<<@o3<<"*-*-*"@o4<<"*-*-*"<<t25; @a:=SWAP(@a,"|"," "); @a:=SWAP(@a," "," "); @
  14. Проблема. На крупном предприятии ряд подразделений (продажи, маркетинг, финансисты и т.д.) имеет свои аналитические отделы. Вследствие большого числа аналитических структур некоторые бизнес-процессы по обработке и анализу информации дублируют друг друга или очень похожи, что приводит к дополнительным издержкам и снижению качества выходной информации. Вопрос. Подскажите, где можно найти конкретные методики и информацию по существующей практике объединения разрозненных аналитических структур на предприятии в единый информационно-аналитический центр. В каких компаниях в России подобные цент
×
×
  • Создать...