Вопросы по теме 'stringi'
Как разбить строку справа налево, как rsplit() в Python?
Предположим, вектор:
xx.1 <- c("zz_ZZ_uu_d", "II_OO_d")
Я хочу получить новый вектор, разделенный справа и только один раз. Ожидаемые результаты:
c("zz_ZZ_uu", "d", "II_OO", "d").
Это было бы похоже на функцию rsplit() Python....
2067 просмотров
schedule
26.05.2022
stri_split_fixed в таблице данных в R
У меня есть таблица данных DT следующим образом.
DT <- structure(list(V1 = structure(1:3, .Label = c("S01", "S02", "S03" ), class = "factor"), V2 = structure(c(1L, 3L, 2L), .Label = c("Alan Hal << Guy John", "Bruce Dick Jean-Paul...
459 просмотров
schedule
12.12.2022
Как определить границы предложений с помощью OpenNLP и stringi?
Я хочу разбить следующие string на предложения:
library(NLP) # NLP_0.1-7
string <- as.String("Mr. Brown comes. He says hello. i give him coffee.")
Я хочу продемонстрировать два разных способа. Один из пакета openNLP :...
770 просмотров
schedule
01.12.2022
Как использовать обратную ссылку с пакетом stringi?
В R я могу использовать \\1 для ссылки на группу захвата. Однако при использовании пакета stringi это не работает должным образом.
library(stringi)
fileName <- "hello-you.lst"
(fileName <- stri_replace_first_regex(fileName,...
416 просмотров
schedule
01.06.2023
Сравнение двух больших строковых векторов занимает слишком много времени (удалите стоп-слова)
Я пытаюсь подготовить набор данных для машинного обучения. В процессе я хотел бы удалить (стоп) слова, которые встречаются редко (часто связанные с плохим чтением OCR). В настоящее время у меня есть список слов, содержащий около 1 млн слов, которые...
100 просмотров
schedule
27.07.2022
Извлечь 2 термина перед конкретным символом
Я хочу извлечь два слова, предшествующие Twitter @handle
x <- c("this is a @handle", "My name is @handle", "this string has @more than one @handle")
Выполнение следующего извлекает весь текст, предшествующий последнему только @handle,...
149 просмотров
schedule
03.06.2024
Извлечение текста в R с пакетом stringi
У меня есть текст ниже, и мне нужно извлечь определенные слова до и после определенного слова.
Пример:
sometext <- "about us, close, products & services, focus, close, research & development, topics, carbon fiber reinforced...
82 просмотров
schedule
16.11.2023
Фильтр по нескольким шаблонам с filter () и str_detect ()
Я хотел бы отфильтровать фрейм данных, используя сопоставление filter () и str_detect () для нескольких шаблонов без нескольких вызовов функции str_detect (). В приведенном ниже примере я хотел бы отфильтровать фрейм данных df , чтобы отображались...
19363 просмотров
schedule
13.04.2022
Вставьте вертикальную черту между каждым символом строки в R
Как я могу вставить вертикальную черту между каждым символом строки в R? Например, скажем, у меня есть строка «ABC123». Как я могу получить вывод «A|B|C|1|2|3»? Если бы кто-нибудь мог векторизовать эту идею для вектора строк символов, это было бы...
523 просмотров
schedule
09.03.2023
Как удалить символ в кадре данных с помощью пакета stringi?
В настоящее время у меня есть фрейм данных со стандартными KPI, и я хотел бы удалить символ «$» из данных. Однако я могу использовать только одну строку кода в дополнение к обязательному использованию пакета stringi . Глядя на документацию, мне...
156 просмотров
schedule
23.05.2023
stringi ошибка установки: настроить: ошибка: компилятор C не может создавать исполняемые файлы
Я пытаюсь установить пакет stringi после недавнего обновления R до последней версии. Однако я встретил эту ошибку:
* installing *source* package ‘stringi’ ...
** package ‘stringi’ successfully unpacked and MD5 sums checked
checking for local...
2741 просмотров
schedule
09.04.2023
Подсчитать количество вхождений слов из списка во фрейме данных в R
Я работаю над небольшой программой в R, которая позволяет мне подсчитывать количество вхождений из списка во фрейме данных.
Поэтому я импортирую свой фрейм данных и список слов следующим образом.
df <- read.csv("tweets.csv")
wordlist <-...
1818 просмотров
schedule
06.02.2023
Проблема с Appveyor - R package stringi не может быть установлен
В последнее время сборка с Appveyor больше не работает. Это не удается до фактического построения программы, потому что каким-то образом пакет stringi не может быть установлен.
Локально все работает нормально, но мне нужен обходной путь для...
172 просмотров
schedule
01.07.2022
Заменить строку с игнорированием символов
У меня есть следующая строка:
string <- c("ABDSFGHIJLKOP")
и список подстрок:
sub <- c("ABDSF", "SFGH", "GHIJLKOP")
Я хотел бы включить ‹ и > после каждого дополнительного совпадения, получив таким образом:...
147 просмотров
schedule
13.06.2022
Получение уникального количества из структурированных текстовых данных
Мне интересно, как получить уникальное количество символов из текстовой строки из структурированного набора данных. Это дополнительный вопрос к моему предыдущему сообщению. Я хотел бы получить уникальное количество яблок (закодировано как App),...
40 просмотров
schedule
22.06.2023
функция stringr для объединения вектора слов, разделенных запятой, с последним словом и перед ним
Я знаю, что могу легко написать его, но кто-нибудь знает, есть ли у stringr (или stringi) уже функция, которая объединяет вектор из одного или нескольких слов, разделенных запятыми, но с "и" перед последним словом?
70 просмотров
schedule
24.04.2023
Ошибка icudt при установке пакета stringi из r в Linux в автономном режиме
Я загрузил пакет stringi_1.4.3.tar.gz в свою систему (RedHat Linux 7), но когда я пытаюсь установить его в автономном режиме, я получаю сообщение об ошибке, как показано ниже:
Выполнение остановлено *** Загрузка icudt не удалась. остановка....
2117 просмотров
schedule
21.07.2023
извлечь текст из электронной почты и между двумя точками в R
У меня есть адрес электронной почты, с которого я пытаюсь извлечь домен. Я нашел решение здесь , но оно слишком длинная.
Я пытаюсь использовать следующий подход:
Сначала удалите весь текст перед знаком @.
gsub("@(.+)$", "\\1", emails)...
47 просмотров
schedule
22.07.2022
Ошибка при установке пакета stringi на R 4 в Linux Ubuntu
Я пытаюсь установить пакет roxygen2 на R 4.0 .3 в Linux Ubuntu 16.04.7 LTS. Это не удается, потому что сначала необходимо установить пакет stringi ; Я пытаюсь установить его с помощью обычной команды install.packages("stringi") , но...
85 просмотров
schedule
24.03.2024