sample1 = read.csv("pirate.csv")
sample1[,7]
[1] >>xyz>>hello>>mate 1
[2] >>xyz>>hello>>mate 2
[3] >>xyz>>mate 3
[4] >>xyz>>mate 4
[5] >>xyz>>hello>>mate 5
[6] >>xyz>>hello>>mate 6
Je dois extraire et créer un tableau qui contient tous les mots après la dernière >>
.
Comment faire ça?
Aussi, comment puis-je extraire (a) o qwerty, (b) mate1 et (c) pirate1 dans différentes variables de la chaîne suivante
p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1'
Merci
x <- c('>>xyz>>hello>>mate 1', '>>xyz>>hello>>mate 2', '>>xyz>>mate 3', ' >>xyz>>mate 4' ,'>>xyz>>hello>>mate 5')
sub('.*>>', '', x)
#[1] "mate 1" "mate 2" "mate 3" "mate 4" "mate 5"
En supposant que vous ayez déjà lu ces informations dans une trame de données R, vous pouvez utiliser le package stringr
comme suit:
library(stringr)
str_extract(df$mystring, '\\S+$')
Par exemple, si vous avez une chaîne comme celle-ci:
s <- '>>hello1>>hola1>>ahoy mate1'
Vous obtenez:
str_extract(s, '\\S+$')
[1] "mate1"