web-dev-qa-db-fra.com

AssertionError: col doit être Column

Comment créer une nouvelle colonne dans PySpark et remplir cette colonne avec la date d'aujourd'hui?

Voici ce que j'ai essayé:

import datetime
now = datetime.datetime.now()
df = df.withColumn("date", str(now)[:10])

Je reçois cette erreur:

AssertionError: col doit être Column

10
Markus

Comment créer une nouvelle colonne dans PySpark et remplir cette colonne avec la date d'aujourd'hui?

Il y a déjà une fonction pour ça:

from pyspark.sql.functions import current_date

df.withColumn("date", current_date().cast("string"))

AssertionError: col doit être Column

Utiliser littéral

from pyspark.sql.functions import lit

df.withColumn("date", lit(str(now)[:10]))
20
hi-zir