Вопросы по теме 'qdap'
Более эффективные средства создания корпуса и DTM с 4 млн строк.
В моем файле более 4 миллионов строк, и мне нужен более эффективный способ преобразования моих данных в матрицу терминов корпуса и документа, чтобы я мог передать их байесовскому классификатору.
Рассмотрим следующий код:
library(tm)
GetCorpus...
12231 просмотров
schedule
06.06.2022
тональный анализ с разным количеством документов
Я пытаюсь провести анализ настроений по газетным статьям и отслеживать уровень настроений во времени. Для этого я в основном определяю все релевантные новостные статьи в течение дня, загружаю их в функцию polarity () и получаю средние баллы...
321 просмотров
schedule
17.03.2024
qdap check_spelling Ошибка в checkForRemoteErrors(val): один узел выдал ошибку: аргументы подразумевают разное количество строк
Я столкнулся с ошибкой
Error in checkForRemoteErrors(val) :
one node produced an error: arguments imply differing number of rows: 3, 0
при попытке использовать check_spelling в пакете qdap . Предоставленные числа 3 и 0 относятся к...
631 просмотров
schedule
01.07.2022
Как связать вместе несколько преобразований qdap для интеллектуального анализа текста/анализа настроений (полярности) в R
У меня есть data.frame с номерами недель, week , и текстовыми отзывами, text . Я хотел бы рассматривать переменную week как свою группирующую переменную и запускать для нее базовый текстовый анализ (например, qdap::polarity ). Часть текста...
241 просмотров
schedule
09.07.2022
Версия пакета R (qdapTools) неправильно определяется в Azure ML
Я пытаюсь установить пакет qdap в Azure ML. Остальные зависимые пакеты устанавливаются без проблем. Когда дело доходит до qdapTools, я получаю эту ошибку, хотя я пытаюсь установить версию 1.3.1 (проверил это из файла описания, который поставляется с...
406 просмотров
schedule
05.10.2022
Пользовательские слова в пакете «qdap» в R
Я использую пакет qdap в R для проверки орфографии. Я запускаю приведенный ниже код и выдаю такой результат
which_misspelled("I use a 50Gb broadband connection")
> 4 5
>"gb" "broadband"
Слова имеют смысл, но исправления...
446 просмотров
schedule
13.07.2022
Поиск повторяющихся предложений/слов/фраз по группам с течением времени
У меня есть набор данных, в котором каждый столбец является переменной, а каждая строка представляет собой наблюдение (например, данные временных рядов. Это выглядит так (извиняюсь за формат, но я не могу показать данные):
Я хотел бы знать,...
185 просмотров
schedule
06.07.2023
R3.5.0 и data.tables не работают
отредактировано 2018-04-26: Изменено название в соответствии с комментариями, это более широкая проблема с R3.5.0.
оригинал:
Я новичок в R и не разбираюсь во всех его радостях.
Я только что обновил свой рабочий компьютер (результат!) до...
1111 просмотров
schedule
11.07.2023
Функция beg2char в R (пакет qdap)
Я пытаюсь сохранить только ту часть строки, которая осталась от "keyword" . Все, что находится справа от "keyword" , должно быть удалено. beg2char кажется лучшим выбором, но он не делает того, что я думал.
Пожалуйста, порекомендуйте:
x...
56 просмотров
schedule
06.04.2024
Как отфильтровать все короткие строки (2 и меньше символов) в корпусе?
Учитывая простую строку:
t <- "hello world ww ff a wr gj dkjffdkn kuku"
VCorpus(VectorSource(t))
Я хочу отфильтровать все подстроки длиной 2 и меньше. Как это сделать с помощью пакетов qdap или tm ? Я знаю, что могу использовать...
30 просмотров
schedule
08.07.2022