ROSES предлагает новую, специально оптимизированную для поиска в корпоративной интранет-среде модель, предусматривающую:
- Поиск с учетом русской морфологии
Морфологические алгоритмы позволяют осуществлять поиск с учетом словоформ русского языка, повышая полноту и точность выдаваемых результатов;
Устранение алиасов и двусмысленностей. Значительная часть информационных шумов в интранет возникает вследствие большого числа почти идентичных документов. Например, если вы создали и разослали по почте презентацию, десятки её копий могут храниться в различных файловых директориях других сотрудников.
- Определение идентичности информационных материалов
ROSES обеспечивает определение идентичности информационных материалов и устраняет их многократное дублирование в представляемых пользователю результатах;
Таких как: автор, дата создания, тип документа, заголовок и так далее в момент индексации документа. Эта информация индексируется отдельно и может использоваться в поиске. А также существует возможность использования в поиске пользовательских метаданных, содержащихся в информационном источнике;
Анализ с целью выявления ключевых слов, по которым выдаются неадекватные результаты;
- Возможность конфигурирования "Рекомендуемых ссылок"
Для организации поиска по наиболее популярным ключевым словам.
-
Аутентификация и фильтрация результатов поиска
ROSES позволяет полностью решить задачи защиты информации и разграничения прав доступа к результатам поиска. Все источники - документы в файловых архивах и специализированных репозиториях, страницы OracleAS Portal, архивы электронной почты - могут быть защищены. При этом результаты поиска фильтруются так, что для пользователя видимы ссылки только на те информационные ресурсы, к которым ему разрешён доступ. Предоставляются три способа разграничения доступа:
- В соответствии с централизованной схемой аутентификации на основе корпоративных каталогов пользователей, определяющих, к каким информационным источникам пользователю разрешён доступ.Например, если в соответствии с его LDAP - привилегиями пользователь не имеет прав доступа к OracleAS Portal, ему не будет показана ссылка ни на один документ из портального решения;
- Для реализации большего уровня гранулированности доступа, ROSES может хранить информацию о правах доступа в списках контроля доступа (Account Control List - ACL), ассоциированных с каждым документом. ROSES получает ACL для каждого документа непосредственно из информационного репозитория.
- Если репозиторий не поддерживает данной функциональности, администратор имеет возможность определить права доступа к каждому из источников непосредственно из административной консоли ROSES. В этом случае, права присваиваются прописанным в LDAP группам или непосредственно пользователям, определенным LDAP. Например, группа источников, проиндексированных в процессе поиска, может быть отмечена как видимая для групп "Аналитики", "Маркетинг" и пользователей "Петров", "Сидоров", "Ковалёв";
Фильтрация результатов поиска через механизм авторизации исходного информационного источника (авторизация в момент выполнения). Для того, чтобы избежать дублирования информации о правах доступа, ROSES интегрирован с каталогом пользователей на основе Oracle Internet Directory (OID), который может синхронизироваться с каталогами других производителей, например, Microsoft Active Directory.
Пользователь ROSES получает настраиваемый, интуитивно понятный русскоязычный интерфейс, аналогичный интерфейсу других популярных систем поиска в Интернет.
Дополнительные функции Roses
- Поиск слов, близких по написанию;
- Нечеткий поиск;
- Расширение запроса синонимами, более общими и более частными понятиями на основе тезауруса общей лексики русского языка;
- Поиск документов по ключевым темам, которые автоматически выделяются при индексировании;
- Выявление смысловых связей между темами документов, что позволяет расширять или уточнять запрос ассоциативно близкими темами;
- Составление общих и тематических рефератов документов;
- Автоматическое построение иерархических рубрикаторов и классификация документов по рубрикам.