Блог — Измеритель эквивалентности понятий

08 апреля 2008 в 17.41
Автор: Степан Овчинников

Естественные языки содержат множество слов, близких в том или ином смысле. Для машинного понимания текстов крайне важно, чтобы машины умели распознавать степень схожести слов.

Предлагаю на суд публики простой механизм, определяющий, насколько близки два слова. База довольно приличная, по общеупотребительным словам обычно результат небессмысленный.

Проценты истолковываются просто: 0 значит нет совпадения, 100 значит почти совпадают (пробуйте бегемота и гиппопотама). От 40% и выше значит что слова существенно схожи. Меньше - обычно вилами по воде.

У меня есть некоторые мысли, какие замечательно полезные штуки можно реализовать с применением словарей и информации о тематической близости слов.

Применения этой задумке пока нет, но…
Смотрите, тестируйте: измеритель близости понятий: http://stepan.intervolga.ru/simple/
 

Поделиться

Оставить комментарий:

Заинтересовали наши работы?

Закажите новый сайт

Заполните анкету, мы свяжемся с Вами и назначим встречу

Хотите привлечь клиентов?

Закажите рекламу

Мы предложим вам различные варианты рекламы сайта