Я хотел бы использовать модель genism doc2vec для задачи классификации. Однако похоже, что реализация doc2vec в gensim требует просмотра всех документов (обучающих и тестовых) для создания словаря перед обучением модели. В противном случае вы получите ошибку ключа, если хотите получить вектор документа документа, которого не было при построении словаря. Интересно, правильно ли я понимаю! На практике во время обучения нет доступа к тестовым данным.
Есть ли способ обновить словарный запас во время теста, чтобы иметь возможность получить документальное представление тестовых документов?