Extraire le texte après un symbole dans R

Question

sample1 = read.csv("pirate.csv") sample1[,7] [1] >>xyz>>hello>>mate 1 [2] >>xyz>>hello>>mate 2 [3] >>xyz>>mate 3 [4] >>xyz>>mate 4 [5] >>xyz>>hello>>mate 5 [6] >>xyz>>hello>>mate 6

Je dois extraire et créer un tableau qui contient tous les mots après la dernière >>.

Comment faire ça?

Aussi, comment puis-je extraire (a) o qwerty, (b) mate1 et (c) pirate1 dans différentes variables de la chaîne suivante

p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1'

Merci

Sotos · Accepted Answer

x <- c('>>xyz>>hello>>mate 1', '>>xyz>>hello>>mate 2', '>>xyz>>mate 3', ' >>xyz>>mate 4' ,'>>xyz>>hello>>mate 5') sub('.*>>', '', x) #[1] "mate 1" "mate 2" "mate 3" "mate 4" "mate 5"

Gopala · Answer

En supposant que vous ayez déjà lu ces informations dans une trame de données R, vous pouvez utiliser le package stringr comme suit:

library(stringr) str_extract(df$mystring, '\S+$')

Par exemple, si vous avez une chaîne comme celle-ci:

s <- '>>hello1>>hola1>>ahoy mate1'

Vous obtenez:

str_extract(s, '\S+$') [1] "mate1"