Фильтрация строк, факторы в R

Фильтрация строки, содержащей определенную строку, с помощью dplyr

Привет, ребята,

V2 — столбец, факторная классификация.

Я пытаюсь отфильтровать следующее, но получаю 0 значений:

MSFT <- dplyr::filter(Tweets, grepl("$MSFT", V2) ) 

Как ни странно, это работает:

MSFT <- dplyr::filter(Tweets, grepl("MSFT", V2) ) 

Но я хочу именно MSFT, а не MSFTXXX или MSFT и т.д.

Спасибо :)


person Wagish    schedule 21.09.2015    source источник
comment
избежать $ (т.е. \\$)   -  person hrbrmstr    schedule 21.09.2015
comment
$ означает конец строки --- поэтому вставьте его там, где вы хотите, чтобы конец был: "MSFT$". $MSFT ищет строку, которая заканчивается, а затем после окончания есть MSFT.   -  person Gregor Thomas    schedule 21.09.2015
comment
ах, я думал, что это больше $MSFT похоже на котировку акций. вам нужно будет добавить границы слов регулярного выражения, если вы хотите MSFT где-нибудь в 140 символах.   -  person hrbrmstr    schedule 21.09.2015
comment
Хорошо, спасибо ! @hrbrmstr, да, это как хэштег в твиттере, я имею дело с данными твиттера во время краха 2008-2010. Мне удалось сделать следующее: $GE' ‹- dplyr::filter(Tweets, grepl(\\bGE$\\b, V2)) чтобы получить точный фильтр :)   -  person Wagish    schedule 22.09.2015
comment
stackoverflow.com/questions/17906003/   -  person Wagish    schedule 22.09.2015