У меня есть корпус предложений, которые были предварительно обработаны системами Стэнфорда CoreNLP. Одна из вещей, которые он предоставляет, - это дерево синтаксического анализа предложения (на основе избирательных округов). Хотя я могу понять дерево синтаксического анализа, когда оно нарисовано (например, дерево), я не уверен, как его читать в этом формате:
E.g.:
(ROOT
(FRAG
(NP (NN sent28))
(: :)
(S
(NP (NNP Rome))
(VP (VBZ is)
(PP (IN in)
(NP
(NP (NNP Lazio) (NN province))
(CC and)
(NP
(NP (NNP Naples))
(PP (IN in)
(NP (NNP Campania))))))))
(. .)))
Исходное предложение:
sent28: Rome is in Lazio province and Naples in Campania .
Как я должен читать это дерево или, альтернативно, есть ли код (на Python), который делает это правильно? Спасибо.