Курсы валют
на 16.12.2017
Курс доллара США
Курс евро
Биржевой курс доллара США
Биржевой курс евро

Все валюты

Сегодня понедельник, 18.12.2017, ньюсмейкеров: 37982, сайтов: 360, публикаций: 2220576
Новости. Опубликовано 05.12.2006 00:00 МСК.  Просмотров всего: 370; сегодня: 1.

Обработка и создание отчета похожести документов, уже находящихся в базе (выявление дублей)

Обработка и создание отчета похожести документов, уже находящихся в базе (выявление дублей)

Достаточно распространенное явление содержащиеся в информационной базе предприятия дублирующие друг друга текстовые документы из различных источников или внесенные разными людьми. Так как информация, как правило, накапливалась годами, то чтобы полностью использовать все преимущества поисковой системы SearchInform необходимо вначале избавить информационную систему от ненужных дублей. Для определения дублей и ненужных похожих файлов в программе поиска SearchInform используется функция построения отчета анализа похожести. Притом эта операция занимает в десятки раз меньше времени, чем при обычном сравнении. Для примера, сравнение документов в информационной базе, в которой содержится, скажем, несколько миллионов документов, займет около месяца. А при использовании в поисковой программе SearchInform функции построения анализа похожести - порядка суток.
Основные возможности SearchInform 3.0:
- Фразовый поиск с учетом морфологии и словаря синонимов
- Новая технология поиска похожих документов SoftInform Search Technology
- Высокая скорость индексирования (от 15 до 30 Гб/час)
- Размер индекса 15-25% от реального объема текстовой информации
- Функция кэширования запросов
- Поддержка более 60 распространенных текстовых форматов файлов, электронных сообщений Outlook и TheBat, тэгов mp3 и avi и логов программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger)
- Корректная работа с архивами
- Универсальные источники данных (индексирование полей СУБД и различных информационных систем)
О компании СофтИнформ
Компания СофтИнформ была основана в 1995 году и работает в сфере информационных технологий, специализируясь на технологиях поиска, хранения и обработки информации. Спектр предлагаемых компанией разработок весьма широк и включает в себя как тиражные программные продукты, ориентированные на обычного пользователя, так и готовые решения для интеграции в корпоративные системы. Кроме того, огромный опыт участия в различных проектах позволяет компании предлагать свои услуги по разработке под заказ информационных систем любой сложности.


Ньюсмейкер: SearchInform — 115 публикаций
Сайт: www.searchinform.com

Контакты с пресс-службой:
E-mail: press@softinform.com
Печать
Поделиться:
Порадовать себя гастрономическим туром в одном месте Новогодние ёлки - самые зрелищные мероприятия от семейных кафе Kitchen в уходящем году Современные перспективы лечения рака желудка в клинике МЕДСИ на Пятницком шоссе Камчатские активисты примут участие в «Форуме Действий» ОНФ «Россия устремленная в будущее» Врачи-волонтеры принимают участие в мероприятиях проекта «Интегративное волонтерство» Энергетики филиала Ивэнерго переведены в режим повышенной готовности В НИЕВ рассказали как рассчитать налоги Благотворительная акция «С миру по елке» подводит итоги Счастливая продленка для младших школьников в Санкт-Петербурге Поселок «Кембридж» получил награду в Brick Award Russia-2017