Блог — Результат поиска "естественный язык"
В продолжение начатых тем об эквивалентности понятий и близости тем предлагаю рубрикатор новостей. В качестве эталонного классификатора выбраны рубрики Яндекса. Результат выводится не только в виде ответа, но и облаком. Иногда познавательно.
Проверим: http://stepan.intervolga.ru/classifier/
Естественный язык является не только средством называния предметов, но и описания процессов, явлений, связей, утверждений. Для того, чтобы учиться рассуждать по принципу "Сократ-человек, люди смертны, Сократ смертен" без задания правил вручную, компьютеры должны уметь понимать, к каким темам близки слова.
Продолжая тему поста про степень эквивалентности смыслов, хочу показать как решается другая задача из той же области. Часто надо оценить, к одной или совсем разным областям знания (группам понятий, тематикам), относятся слова.
Естественные языки содержат множество слов, близких в том или ином смысле. Для машинного понимания текстов крайне важно, чтобы машины умели распознавать степень схожести слов.
Предлагаю на суд публики простой механизм, определяющий, насколько близки два слова. База довольно приличная, по общеупотребительным словам обычно результат небессмысленный.
|