Вопросы по теме 'stringi'

Как разбить строку справа налево, как rsplit() в Python?
Предположим, вектор: xx.1 <- c("zz_ZZ_uu_d", "II_OO_d") Я хочу получить новый вектор, разделенный справа и только один раз. Ожидаемые результаты: c("zz_ZZ_uu", "d", "II_OO", "d"). Это было бы похоже на функцию rsplit() Python....
2067 просмотров
schedule 26.05.2022

stri_split_fixed в таблице данных в R
У меня есть таблица данных DT следующим образом. DT <- structure(list(V1 = structure(1:3, .Label = c("S01", "S02", "S03" ), class = "factor"), V2 = structure(c(1L, 3L, 2L), .Label = c("Alan Hal << Guy John", "Bruce Dick Jean-Paul...
459 просмотров
schedule 12.12.2022

Как определить границы предложений с помощью OpenNLP и stringi?
Я хочу разбить следующие string на предложения: library(NLP) # NLP_0.1-7 string <- as.String("Mr. Brown comes. He says hello. i give him coffee.") Я хочу продемонстрировать два разных способа. Один из пакета openNLP :...
770 просмотров
schedule 01.12.2022

Как использовать обратную ссылку с пакетом stringi?
В R я могу использовать \\1 для ссылки на группу захвата. Однако при использовании пакета stringi это не работает должным образом. library(stringi) fileName <- "hello-you.lst" (fileName <- stri_replace_first_regex(fileName,...
416 просмотров
schedule 01.06.2023

Сравнение двух больших строковых векторов занимает слишком много времени (удалите стоп-слова)
Я пытаюсь подготовить набор данных для машинного обучения. В процессе я хотел бы удалить (стоп) слова, которые встречаются редко (часто связанные с плохим чтением OCR). В настоящее время у меня есть список слов, содержащий около 1 млн слов, которые...
100 просмотров

Извлечь 2 термина перед конкретным символом
Я хочу извлечь два слова, предшествующие Twitter @handle x <- c("this is a @handle", "My name is @handle", "this string has @more than one @handle") Выполнение следующего извлекает весь текст, предшествующий последнему только @handle,...
149 просмотров
schedule 03.06.2024

Извлечение текста в R с пакетом stringi
У меня есть текст ниже, и мне нужно извлечь определенные слова до и после определенного слова. Пример: sometext <- "about us, close, products & services, focus, close, research & development, topics, carbon fiber reinforced...
82 просмотров
schedule 16.11.2023

Фильтр по нескольким шаблонам с filter () и str_detect ()
Я хотел бы отфильтровать фрейм данных, используя сопоставление filter () и str_detect () для нескольких шаблонов без нескольких вызовов функции str_detect (). В приведенном ниже примере я хотел бы отфильтровать фрейм данных df , чтобы отображались...
19363 просмотров
schedule 13.04.2022

Вставьте вертикальную черту между каждым символом строки в R
Как я могу вставить вертикальную черту между каждым символом строки в R? Например, скажем, у меня есть строка «ABC123». Как я могу получить вывод «A|B|C|1|2|3»? Если бы кто-нибудь мог векторизовать эту идею для вектора строк символов, это было бы...
523 просмотров
schedule 09.03.2023

Как удалить символ в кадре данных с помощью пакета stringi?
В настоящее время у меня есть фрейм данных со стандартными KPI, и я хотел бы удалить символ «$» из данных. Однако я могу использовать только одну строку кода в дополнение к обязательному использованию пакета stringi . Глядя на документацию, мне...
156 просмотров
schedule 23.05.2023

stringi ошибка установки: настроить: ошибка: компилятор C не может создавать исполняемые файлы
Я пытаюсь установить пакет stringi после недавнего обновления R до последней версии. Однако я встретил эту ошибку: * installing *source* package ‘stringi’ ... ** package ‘stringi’ successfully unpacked and MD5 sums checked checking for local...
2741 просмотров
schedule 09.04.2023

Подсчитать количество вхождений слов из списка во фрейме данных в R
Я работаю над небольшой программой в R, которая позволяет мне подсчитывать количество вхождений из списка во фрейме данных. Поэтому я импортирую свой фрейм данных и список слов следующим образом. df <- read.csv("tweets.csv") wordlist <-...
1818 просмотров
schedule 06.02.2023

Проблема с Appveyor - R package stringi не может быть установлен
В последнее время сборка с Appveyor больше не работает. Это не удается до фактического построения программы, потому что каким-то образом пакет stringi не может быть установлен. Локально все работает нормально, но мне нужен обходной путь для...
172 просмотров
schedule 01.07.2022

Заменить строку с игнорированием символов
У меня есть следующая строка: string <- c("ABDSFGHIJLKOP") и список подстрок: sub <- c("ABDSF", "SFGH", "GHIJLKOP") Я хотел бы включить ‹ и > после каждого дополнительного совпадения, получив таким образом:...
147 просмотров
schedule 13.06.2022

Получение уникального количества из структурированных текстовых данных
Мне интересно, как получить уникальное количество символов из текстовой строки из структурированного набора данных. Это дополнительный вопрос к моему предыдущему сообщению. Я хотел бы получить уникальное количество яблок (закодировано как App),...
40 просмотров
schedule 22.06.2023

функция stringr для объединения вектора слов, разделенных запятой, с последним словом и перед ним
Я знаю, что могу легко написать его, но кто-нибудь знает, есть ли у stringr (или stringi) уже функция, которая объединяет вектор из одного или нескольких слов, разделенных запятыми, но с "и" перед последним словом?
70 просмотров
schedule 24.04.2023

Ошибка icudt при установке пакета stringi из r в Linux в автономном режиме
Я загрузил пакет stringi_1.4.3.tar.gz в свою систему (RedHat Linux 7), но когда я пытаюсь установить его в автономном режиме, я получаю сообщение об ошибке, как показано ниже: Выполнение остановлено *** Загрузка icudt не удалась. остановка....
2117 просмотров

извлечь текст из электронной почты и между двумя точками в R
У меня есть адрес электронной почты, с которого я пытаюсь извлечь домен. Я нашел решение здесь , но оно слишком длинная. Я пытаюсь использовать следующий подход: Сначала удалите весь текст перед знаком @. gsub("@(.+)$", "\\1", emails)...
47 просмотров
schedule 22.07.2022

Ошибка при установке пакета stringi на R 4 в Linux Ubuntu
Я пытаюсь установить пакет roxygen2 на R 4.0 .3 в Linux Ubuntu 16.04.7 LTS. Это не удается, потому что сначала необходимо установить пакет stringi ; Я пытаюсь установить его с помощью обычной команды install.packages("stringi") , но...
85 просмотров
schedule 24.03.2024