Пользовательские слова в пакете «qdap» в R

Я использую пакет qdap в R для проверки орфографии. Я запускаю приведенный ниже код и выдаю такой результат

which_misspelled("I use a 50Gb broadband connection") 

> 4           5 
>"gb" "broadband"

Слова имеют смысл, но исправления для них не имеют значения. Есть ли какой-либо вариант, в котором мы могли бы указать наш собственный список слов, чтобы эта функция не фильтровала?


person Jil Jung Juk    schedule 28.11.2016    source источник


Ответы (1)


Функция which_misspelled() содержит аргумент dictionary =, который по умолчанию равен qdapDictionaries::GradyAugmented. Если введенных вами слов там нет, они будут считаться с ошибками.

Если вы хотите, например, чтобы слово "gb" распознавалось как правильное написание, вы должны определить новый dictionary :

library(qdap)
dict <- c(qdapDictionaries::GradyAugmented, "gb")
which_misspelled("I use a 50Gb broadband connection", dictionary = dict)
#          5 
#"broadband" 
person mtoto    schedule 28.11.2016