Я использую from nltk.tokenize import word_tokenize
, которому нужен punkt
. В коде вы можете скачать его с помощью nltk.download('punkt')
.
У меня есть nltk
как требование, но нет цели nltk[punkt]
. Есть ли другой способ установить это в моем setup.py
как требование? Каков рекомендуемый способ борьбы с этой зависимостью данных от nltk?
Текущее «решение»
В настоящее время я просто вызываю nltk.download('punkt')
внутри функции... поэтому каждый раз, когда я вызываю эту функцию, она замедляется.