Как я могу правильно управлять зависимостями nltk?

Я использую from nltk.tokenize import word_tokenize, которому нужен punkt. В коде вы можете скачать его с помощью nltk.download('punkt').

У меня есть nltk как требование, но нет цели nltk[punkt]. Есть ли другой способ установить это в моем setup.py как требование? Каков рекомендуемый способ борьбы с этой зависимостью данных от nltk?

Текущее «решение»

В настоящее время я просто вызываю nltk.download('punkt') внутри функции... поэтому каждый раз, когда я вызываю эту функцию, она замедляется.


person Martin Thoma    schedule 12.07.2019    source источник