Вопросы по теме 'qdap'

Более эффективные средства создания корпуса и DTM с 4 млн строк.
В моем файле более 4 миллионов строк, и мне нужен более эффективный способ преобразования моих данных в матрицу терминов корпуса и документа, чтобы я мог передать их байесовскому классификатору. Рассмотрим следующий код: library(tm) GetCorpus...
12231 просмотров

тональный анализ с разным количеством документов
Я пытаюсь провести анализ настроений по газетным статьям и отслеживать уровень настроений во времени. Для этого я в основном определяю все релевантные новостные статьи в течение дня, загружаю их в функцию polarity () и получаю средние баллы...
321 просмотров
schedule 17.03.2024

qdap check_spelling Ошибка в checkForRemoteErrors(val): один узел выдал ошибку: аргументы подразумевают разное количество строк
Я столкнулся с ошибкой Error in checkForRemoteErrors(val) : one node produced an error: arguments imply differing number of rows: 3, 0 при попытке использовать check_spelling в пакете qdap . Предоставленные числа 3 и 0 относятся к...
631 просмотров
schedule 01.07.2022

Как связать вместе несколько преобразований qdap для интеллектуального анализа текста/анализа настроений (полярности) в R
У меня есть data.frame с номерами недель, week , и текстовыми отзывами, text . Я хотел бы рассматривать переменную week как свою группирующую переменную и запускать для нее базовый текстовый анализ (например, qdap::polarity ). Часть текста...
241 просмотров
schedule 09.07.2022

Версия пакета R (qdapTools) неправильно определяется в Azure ML
Я пытаюсь установить пакет qdap в Azure ML. Остальные зависимые пакеты устанавливаются без проблем. Когда дело доходит до qdapTools, я получаю эту ошибку, хотя я пытаюсь установить версию 1.3.1 (проверил это из файла описания, который поставляется с...
406 просмотров
schedule 05.10.2022

Пользовательские слова в пакете «qdap» в R
Я использую пакет qdap в R для проверки орфографии. Я запускаю приведенный ниже код и выдаю такой результат which_misspelled("I use a 50Gb broadband connection") > 4 5 >"gb" "broadband" Слова имеют смысл, но исправления...
446 просмотров
schedule 13.07.2022

Поиск повторяющихся предложений/слов/фраз по группам с течением времени
У меня есть набор данных, в котором каждый столбец является переменной, а каждая строка представляет собой наблюдение (например, данные временных рядов. Это выглядит так (извиняюсь за формат, но я не могу показать данные): Я хотел бы знать,...
185 просмотров
schedule 06.07.2023

R3.5.0 и data.tables не работают
отредактировано 2018-04-26: Изменено название в соответствии с комментариями, это более широкая проблема с R3.5.0. оригинал: Я новичок в R и не разбираюсь во всех его радостях. Я только что обновил свой рабочий компьютер (результат!) до...
1111 просмотров
schedule 11.07.2023

Функция beg2char в R (пакет qdap)
Я пытаюсь сохранить только ту часть строки, которая осталась от "keyword" . Все, что находится справа от "keyword" , должно быть удалено. beg2char кажется лучшим выбором, но он не делает того, что я думал. Пожалуйста, порекомендуйте: x...
56 просмотров
schedule 06.04.2024

Как отфильтровать все короткие строки (2 и меньше символов) в корпусе?
Учитывая простую строку: t <- "hello world ww ff a wr gj dkjffdkn kuku" VCorpus(VectorSource(t)) Я хочу отфильтровать все подстроки длиной 2 и меньше. Как это сделать с помощью пакетов qdap или tm ? Я знаю, что могу использовать...
30 просмотров
schedule 08.07.2022