На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2001-12-20 на главную / новости от 2001-12-20
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 20 декабря 2001 г.

ABBYY ударила морфологией по однокоренным словам

Электронный каталог Юридической научной библиотеки издательства “Спарк” принял на вооружение технологию полнотекстового поиска ABBYY Retrieval & Morphology 4.0 Engine (ARME), разработанную компанией ABBYY. С ее помощью поиск нужной книги или статьи занимает секунды.

Первоначально в электронном каталоге (он был создан в 1998 г.) использовалась система, учитывающая корень слова. Однако она имела существенный недостаток: например, если в такой системе задать для поиска ключевое слово “суд”, то она также выдаст в качестве результата документы, содержащие слова “судно” или “судейство”.

Пока в каталоге было не слишком много позиций, читатели вручную корректировали результаты поиска. Но когда количество записей в электронном каталоге превысило 100 тыс., подобная система поиска стала вызывать нарекания читателей.

Тогда и было принято решение сменить поисковый алгоритм. Изучив имеющиеся на рынке пакеты, руководство библиотеки остановило свой выбор на продукте компании ABBYY, с помощью которого можно реализовать полнотекстовой поиск с учетом морфологии.

Если, например, ключевым словом для поиска будет “ребенок”, то система найдет также документы, в которых встречается множественное число “дети”, хотя корни у этих слов разные. При этом слова однокорневые, но не являющиеся словоформами искомого, будут отброшены.

 

← ноябрь 2001 15  17  18  19  20  21  23  24  25 январь 2002 →
Реклама!
 

 

Место для Вашей рекламы!