J'essaie de comprendre comment fonctionne l'enregistrement dans R Studio.
Lorsque je crée un nouveau projet, un fichier .RProj est créé. Chaque fois que je travaille dans R Studio, Enregistrer et Enregistrer sous sont grisés dans le menu Fichier. La seule façon dont je sais comment créer un fichier .RProj est lors du démarrage d'un nouveau projet.
Dans la section environnement, je peux voir une icône Enregistrer une disquette. Lorsque je clique dessus, il crée un fichier .RData. Chaque fois que je veux enregistrer, je clique sur cette icône d'enregistrement et écrase le fichier.
Quelqu'un peut-il expliquer quelles sont les meilleures pratiques pour l'enregistrement lors de l'utilisation de R Studio et les principales distinctions entre les fichiers .RProj et .RData?
Vous devriez probablement lire tilisation de projets - Prise en charge RStudio . Les projets R sont super utiles, mais ils ne sont pas destinés à enregistrer des données de votre environnement R. Ils sont exclusivement utilisés par l'éditeur de code RStudio. L'une des plus belles choses qu'ils font est de définir automatiquement votre répertoire de travail sur le répertoire du projet lorsque vous en ouvrez un. Ils se souviennent également des fichiers que vous aviez ouverts dans RStudio, et d'autres préférences liées à l'édition et autres. Utilisez certainement RProjects!
.RData
Est un fichier d'objets R. Vous pouvez créer un fichier de données R à partir de R (pas seulement RStudio) à l'aide de la commande save()
et les recharger ultérieurement dans votre espace de travail avec load()
. Vous pouvez enregistrer tous les objets dans votre espace de travail (save.image
Le fait automatiquement - c'est un wrapper autour de save()
) ou seulement des objets spécifiques. Voir ?save
Pour plus de détails. (Pour les objets uniques, les fichiers .rds créés avec saveRDS
sont préférés.)
Pendant de nombreuses années (bien avant que RStudio ne soit créé), le RGui par défaut a donné la possibilité d'enregistrer tous les objets de votre espace de travail dans un fichier .RData à la sortie. RStudio propose également cette option (sauf si vous la désactivez).
L'icône de "sauvegarde" de la disquette en haut de la fenêtre de l'éditeur dans RStudio n'enregistre pas les objets R, elle enregistre uniquement le code que vous avez écrit dans vos scripts. L'onglet "Environnement" possède également une icône d'enregistrement de disquette, qui enregistrera les objets R.
Cela entre dans les opinions de style; Il n'y a pas de réponse définitive. Ma préférence personnelle est de ne jamais faire une sauvegarde de tous les objets dans mon espace de travail car cela permet une mauvaise habitude de pas en gardant le code nécessaire pour créer ces objets. J'enregistre tous mes scripts, et si un ou des objets particuliers prennent du temps à créer, je vais enregistrer leur enregistrement -
saveRDS(object = final_model, file = "final_model.rds")
Je traite un modèle ou un ensemble de données nettoyé un peu comme un joli tracé dans le code - conservez le code pour le faire au cas où vous voudriez le modifier, mais enregistrez la sortie dans un fichier afin de ne pas avoir à exécuter le code pour recréer chaque fois que vous voulez le regarder.
Pour les projets plus importants, j'essaie de garder la portée d'un script individuel petit et je numérote souvent les scripts (dans l'ordre que je voudrais les exécuter pour commencer depuis le début) comme suggéré par les réponses à Workflow pour l'analyse statistique et rédaction du rapport . La plupart des scripts commencent par lire les objets dont ils dépendent et finissent par enregistrer leurs sorties.
La fonction save()
crée une représentation de vos objets R dans un fichier spécifié. Plus tard, les objets peuvent être lus à partir de ceux spécifiés avec les fonctions load()
, attach()
ou data()
dans certains cas, comme pour les jeux de données intégrés de R. Il permet de sauvegarder les objets et fonctions que vous avez créés dans un fichier .RData. Il est très important d'inclure l'extension .RData lorsque vous indiquez le chemin du fichier. Le fichier help
vous fournira plus de détails.
Les projets RStudio permettent de diviser votre travail en plusieurs contextes, chacun avec son propre répertoire de travail, espace de travail, historique et documents source. La commande Créer un projet vous permet de créer un projet dans un répertoire nouveau ou existant. .RData sont écrits par défaut dans le répertoire du projet. C'est un outil utile pour la gestion de l'espace de travail. Vous pouvez trouver une description détaillée complète des fonctionnalités des projets https://support.rstudio.com/hc/en-us/articles/200526207-Using-Projects .