Quelle est la différence entre gen et egen dans Stata 12?

Question

Y a-t-il une raison pour laquelle il existe deux commandes différentes pour générer une nouvelle variable?

Existe-t-il un moyen simple de se rappeler quand utiliser gen et quand utiliser egen?

griverorz · Accepted Answer

Ils créent tous les deux une nouvelle variable, mais fonctionnent avec des ensembles de fonctions différents. Vous utiliserez généralement gen lorsque vous aurez des transformations simples d’autres variables dans votre jeu de données, comme

gen newvar = oldvar1^2 * oldvar2

egen apparaît généralement lorsque j'ai besoin de fonctions qui fonctionnent pour toutes les observations, comme dans

egen max_var = max(var)

ou des instructions plus complexes

egen newvar = rowmax(oldvar1 oldvar2)

calculer le maximum pour chaque observation entre oldvar1 et oldvar2. Je ne pense pas qu'il y ait une logique claire pour séparer les deux commandes.