Conformément à ceci AWS Forum Thread , quelqu'un sait-il comment utiliser AWS Glue pour créer une table AWS Athena dont les partitions contiennent différents schémas (dans ce cas, différents sous-ensembles de colonnes du schéma de table)?
Pour le moment, lorsque j'exécute le robot sur ces données, puis que j'effectue une requête dans Athena, j'obtiens l'erreur 'Hive_PARTITION_SCHEMA_MISMATCH'
Mon cas d'utilisation est:
Si je devais écrire manuellement un schéma, je pourrais faire très bien car il n'y aurait qu'un seul schéma de table, et les clés manquantes dans le fichier JSON seraient traitées comme des null.
Merci d'avance!
Cela a également résolu mon problème! Si quelqu'un a besoin de provisionner ce robot de configuration avec Terraform, voici comment je l'ai fait:
resource "aws_glue_crawler" "crawler-s3-rawdata" {
database_name = "my_glue_database"
name = "my_crawler"
role = "my_iam_role.arn"
configuration = <<EOF
{
"Version": 1.0,
"CrawlerOutput": {
"Partitions": { "AddOrUpdateBehavior": "InheritFromTable" }
}
}
EOF
s3_target {
path = "s3://mybucket"
}
}