Y a-t-il une raison pour laquelle il existe deux commandes différentes pour générer une nouvelle variable?
Existe-t-il un moyen simple de se rappeler quand utiliser gen
et quand utiliser egen
?
Ils créent tous les deux une nouvelle variable, mais fonctionnent avec des ensembles de fonctions différents. Vous utiliserez généralement gen
lorsque vous aurez des transformations simples d’autres variables dans votre jeu de données, comme
gen newvar = oldvar1^2 * oldvar2
egen
apparaît généralement lorsque j'ai besoin de fonctions qui fonctionnent pour toutes les observations, comme dans
egen max_var = max(var)
ou des instructions plus complexes
egen newvar = rowmax(oldvar1 oldvar2)
calculer le maximum pour chaque observation entre oldvar1
et oldvar2
. Je ne pense pas qu'il y ait une logique claire pour séparer les deux commandes.