В src$Review каждая строка заполняется текстом на русском языке. Я хочу подсчитать CAPSLOCK в каждой строке. Например, в «Мое яблоко ЗЕЛЕНОЕ» я хочу посчитать не просто количество заглавных букв, а количество ЗАГЛАВНЫХ БУКВ (без «Мое», только «ЗЕЛЕНОЕ»). Таким образом, это работает, только если хотя бы два символа представлены в верхнем регистре.
Теперь у меня есть следующий код в моем скрипте:
capscount <- str_count(src$Review, "[А-Я]")
Подсчитывается только общее количество заглавных букв. Мне нужно только общее количество символов, которые находятся в CAPSLOCK, что означает, что эти символы учитываются только в том случае, если отображаются как минимум 2 следующие буквы в слове (например, «GR» в «ЗЕЛЕНЫЙ»).
Заранее спасибо.