Все новости от 20 декабря 2001 г.
ABBYY ударила морфологией по однокоренным словам

Электронный каталог Юридической научной библиотеки издательства “Спарк” принял на вооружение технологию полнотекстового поиска ABBYY Retrieval & Morphology 4.0 Engine (ARME), разработанную компанией ABBYY. С ее помощью поиск нужной книги или статьи занимает секунды.
Первоначально в электронном каталоге (он был создан в 1998 г.) использовалась система, учитывающая корень слова. Однако она имела существенный недостаток: например, если в такой системе задать для поиска ключевое слово “суд”, то она также выдаст в качестве результата документы, содержащие слова “судно” или “судейство”.
Пока в каталоге было не слишком много позиций, читатели вручную корректировали результаты поиска. Но когда количество записей в электронном каталоге превысило 100 тыс., подобная система поиска стала вызывать нарекания читателей.
Тогда и было принято решение сменить поисковый алгоритм. Изучив имеющиеся на рынке пакеты, руководство библиотеки остановило свой выбор на продукте компании ABBYY, с помощью которого можно реализовать полнотекстовой поиск с учетом морфологии.
Если, например, ключевым словом для поиска будет “ребенок”, то система найдет также документы, в которых встречается множественное число “дети”, хотя корни у этих слов разные. При этом слова однокорневые, но не являющиеся словоформами искомого, будут отброшены.
|