Disons que mon schéma MongoDB ressemble à ceci:
{car_id: "...", owner_id: "..."}
Il s'agit d'une relation plusieurs-à-plusieurs. Par exemple, les données peuvent ressembler à ceci:
+-----+----------+--------+
| _id | owner_id | car_id |
+-----+----------+--------+
| 1 | 1 | 1 |
| 2 | 1 | 2 |
| 3 | 1 | 3 |
| 4 | 2 | 1 |
| 5 | 2 | 2 |
| 6 | 3 | 4 |
| 7 | 3 | 5 |
| 8 | 3 | 6 |
| 9 | 3 | 7 |
| 10 | 1 | 1 | <-- not unique
+-----+----------+--------+
Je veux obtenir le nombre de voitures appartenant à chaque propriétaire. En SQL, cela pourrait ressembler à:
SELECT owner_id, COUNT(*) AS cars_owned
FROM (SELECT owner_id FROM car_owners GROUP BY owner_id, car_id) AS t
GROUP BY owner_id;
Dans ce cas, le résultat ressemblerait à ceci:
+----------+------------+
| owner_id | cars_owned |
+----------+------------+
| 1 | 3 |
| 2 | 2 |
| 3 | 4 |
+----------+------------+
Comment puis-je accomplir cette même chose en utilisant MongoDB en utilisant le cadre d'agrégation?
Pour gérer les doublons potentiels, vous devez utiliser deux $group
opérations:
db.test.aggregate([
{ $group: {
_id: { owner_id: '$owner_id', car_id: '$car_id' }
}},
{ $group: {
_id: '$_id.owner_id',
cars_owned: { $sum: 1 }
}},
{ $project: {
_id: 0,
owner_id: '$_id',
cars_owned: 1
}}]
, function(err, result){
console.log(result);
}
);
Donne un résultat au format:
[ { cars_owned: 2, owner_id: 10 },
{ cars_owned: 1, owner_id: 11 } ]
$group
est similaire à SQL Group by command. Dans l'exemple ci-dessous, nous allons regrouper les entreprises en fonction de l'année de leur création. Et calculez le nombre moyen d'employés pour chaque entreprise.
db.companies.aggregate([{
$group: {
_id: {
founded_year: "$founded_year"
},
average_number_of_employees: {
$avg: "$number_of_employees"
}
}
}, {
$sort: {
average_number_of_employees: -1
}
}
])
Ce pipeline d'agrégation comporte 2 étapes
$group
$sort
Maintenant, fondamental pour le $group
l'étape est le _id
champ que nous spécifions comme partie du document. C'est la valeur de $group
opérateur lui-même utilisant une interprétation très stricte de la syntaxe du cadre d'arrogation. _id
est la façon dont nous définissons, comment nous contrôlons, comment nous ajustons ce que la phase de groupe utilise pour organiser les documents qu'elle voit.
La requête ci-dessous permet de trouver les relations des personnes avec les entreprises utilisant $sum
opérateur:
db.companies.aggregate([{
$match: {
"relationships.person": {
$ne: null
}
}
}, {
$project: {
relationships: 1,
_id: 0
}
}, {
$unwind: "$relationships"
}, {
$group: {
_id: "$relationships.person",
count: {
$sum: 1
}
}
}, {
$sort: {
count: -1
}
}])