Suppression de certains caractères d'une chaîne dans R

Question

J'ai une chaîne dans R qui contient une grande quantité de mots. Lorsque je regarde la chaîne, je reçois une grande quantité de texte, qui comprend un texte similaire à celui-ci:

>docs .... \u009cYes yes for ever for ever the boys cried in their ringing voices with softened faces ....

Je me demande donc comment supprimer ces\u009 caractères (dont certains ont des numéros légèrement différents) de la chaîne. J'ai essayé d'utiliser gsub(), mais cela n'a pas été efficace pour supprimer le contenu des chaînes.

agstudy · Accepted Answer

Cela devrait marcher

gsub('\u009c','','\u009cYes yes for ever for ever the boys ') "Yes yes for ever for ever the boys "

Ici 009c est le nombre hexadécimal de Unicode. Vous devez toujours spécifier 4 chiffres hexadécimaux. Si vous en avez plusieurs, une solution consiste à les séparer par un tuyau:

gsub('\u009c|\u00F0','','\u009cYes yes \u00F0for ever for ever the boys and the girls') "Yes yes for ever for ever the boys and the girls"

Nic · Answer

essayez: gsub('\$', '', '$5.00$')