Каков синтаксис в text2vec для векторизации текстов и достижения dtm только с указанным списком слов?
Как векторизовать и создать матрицу терминов документа только по указанным функциям? И если функции не отображаются в тексте, переменная должна оставаться пустой.
Мне нужно создать матрицы документов терминов с точно такими же столбцами, как в dtm, на котором я запускаю моделирование, иначе я не могу использовать модель случайного леса для новых документов.
fcm
, созданном в Quanteda, и, таким образом, использовать все инструменты выбора объектов Quanteda. Если ваш вопрос касается того, как выбирать элементы из вывода text2vec, вам нужно более четко сформулировать эту часть вопроса. Как правило, хорошие вопросы SO проясняют вопрос в начале, а затем предоставляют контекст и только в том случае, если это необходимо для ответа на вопрос. Многое из того, что вы здесь спрашиваете, отвлекает от этого, поскольку я не уверен, на какую часть вам нужен ответ. - person Ken Benoit   schedule 28.07.2017