Существуют ли какие-либо известные способы (помимо статистического анализа, но не обязательно исключающие его как часть решения) связать предложения или концепции друг с другом с помощью обработки естественного языка. До сих пор я работал только с NLTK и Stanford-NLP, чтобы помочь в моем проекте, но я открыт для альтернативных решений с открытым исходным кодом.
В качестве примера возьмем следующее эссе Джорджа Оруэлла (http://orwell.ru/library/essays/wiw/english/e_wiw). Предположим, я дал приложению предложение
"What are George Orwell's opinions on writers."
или возможно
"George Orwell believes writers enjoy writing to express their creativity, to make a point and for their egos."
Могут дать строки из эссе вроде
"The aesthetic motive is very feeble in a lot of writers, but even a pamphleteer or writer of textbooks will have pet words and phrases which appeal to him for non-utilitarian reasons; or he may feel strongly about typography, width of margins, etc."
or
"Serious writers, I should say, are on the whole more vain and self-centered than journalists, though less interested in money."
Я понимаю, что это непросто, и я не могу добиться большой точности, но я надеялся на идеи о том, что уже существует и что я мог бы попробовать начать, или, по крайней мере, получить наилучшие возможные результаты на основе того, что уже известно и что уже известно. там.