В настоящее время я понимаю, что можно извлекать объекты из текстового документа с помощью таких наборов инструментов, как OpenNLP, Stanford NLP.
Однако есть ли способ найти отношения между этими объектами?
Например, рассмотрим следующий текст:
"Некоторые из вас, возможно, знают, что на прошлой неделе я провел в ЦЕРН, европейской лаборатории физики высоких энергий, где в июле прошлого года был открыт знаменитый бозон Хиггса. Каждый раз, когда я приезжаю в ЦЕРН, я испытываю глубокое чувство благоговения. Из кратких посещений в течение многих лет я был там в течение трех месяцев в конце 1990-х в качестве приглашенного ученого, работая над физикой ранней Вселенной, пытаясь понять, как связать Вселенную, которую мы видим сегодня, с тем, что, возможно, произошло в ее младенчестве. "
Сущности: Я (автор), ЦЕРН, бозон Хиггса
Отношения: - Я "посетил" ЦЕРН - ЦЕРН "обнаружил" бозон Хиггса
Спасибо.
entity linking
,anaphora resolution
- person alvas   schedule 07.03.2013entity linking
вы должны проверитьName Entity Recognition
nltk.googlecode.com/svn /trunk/doc/book/ch07.html, чтобы знать, что что-то является сущностью. Затем их связывание позволит вам узнать, какие сущности одинаковы. Тогда вам нужно найти что-то еще, что связывает отношения. Возможноslot-filling
. - person alvas   schedule 07.03.2013NER
, затемentity linking
, а затемslot-filling
. На самом деле весь набор задач может быть полнойknowledge base population
задачей. =) Google больше, я не эксперт в этом, но я сделал некоторую работу ранее. - person alvas   schedule 07.03.2013