Dans MongoDB, est-il possible de mettre à jour la valeur d'un champ en utilisant la valeur d'un autre champ? Le SQL équivalent serait quelque chose comme:
UPDATE Person SET Name = FirstName + ' ' + LastName
Et le pseudo-code MongoDB serait:
db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
La meilleure façon de procéder est la version 4.2+ qui permet d’utiliser le pipeline d’agrégation dans le document de mise à jour et le updateOne
, updateMany
ou update
méthode de collecte. Notez que ce dernier est déconseillé dans la plupart des pilotes de langue, voire dans tous.
La version 4.2 a également introduit l'opérateur $set
, qui est un alias pour $addFields
. Je vais utiliser $set
ici car il mappe avec ce que nous essayons de réaliser.
db.collection.<update method>(
{},
[
{"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
]
)
Dans la version 3.4+, vous pouvez utiliser $addFields
et les opérateurs $out
== ==.
db.collection.aggregate(
[
{ "$addFields": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}},
{ "$out": "collection" }
]
)
Notez que cela ne met pas à jour votre collection, mais remplace la collection existante ou en crée une nouvelle. Aussi pour les opérations de mise à jour nécessitant "type casting" vous aurez besoin d'un traitement côté client, et, selon l'opération, vous devrez peut-être utiliser la méthode find()
à la place de la méthode .aggreate()
.
Pour ce faire, utilisez $project
dans nos documents et utilisez $concat
l'opérateur d'agrégation de chaînes pour renvoyer la chaîne concaténée. À partir de là, vous parcourez le curseur et utilisez l'opérateur $set
pour ajouter le nouveau champ à vos documents à l'aide de opérations en bloc pour une efficacité maximale.
var cursor = db.collection.aggregate([
{ "$project": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}}
])
à partir de là, vous devez utiliser la méthode bulkWrite
.
var requests = [];
cursor.forEach(document => {
requests.Push( {
'updateOne': {
'filter': { '_id': document._id },
'update': { '$set': { 'name': document.name } }
}
});
if (requests.length === 500) {
//Execute per 500 operations and re-init
db.collection.bulkWrite(requests);
requests = [];
}
});
if(requests.length > 0) {
db.collection.bulkWrite(requests);
}
À partir de cette version, vous devez utiliser l'API Bulk
maintenant obsolète et ses méthodes associées .
var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;
cursor.snapshot().forEach(function(document) {
bulk.find({ '_id': document._id }).updateOne( {
'$set': { 'name': document.name }
});
count++;
if(count%500 === 0) {
// Excecute per 500 operations and re-init
bulk.execute();
bulk = db.collection.initializeUnorderedBulkOp();
}
})
// clean up queues
if(count > 0) {
bulk.execute();
}
cursor["result"].forEach(function(document) {
db.collection.update(
{ "_id": document._id },
{ "$set": { "name": document.name } }
);
})
Vous devriez parcourir. Pour votre cas particulier:
db.person.find().snapshot().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
Apparemment, il existe un moyen de le faire efficacement depuis MongoDB 3.4, voir réponse de styvane .
Réponse obsolète ci-dessous
Vous ne pouvez pas (encore) faire référence au document lui-même dans une mise à jour. Vous devrez parcourir les documents et mettre à jour chaque document à l'aide d'une fonction. Voir cette réponse pour un exemple, ou celui-ci pour eval()
côté serveur _.
Pour une base de données très active, vous pouvez rencontrer des problèmes dans lesquels vos mises à jour affectent le changement actif des enregistrements. C'est pourquoi je vous recommande d'utiliser snapshot () .
db.person.find().snapshot().forEach( function (hombre) {
hombre.name = hombre.firstName + ' ' + hombre.lastName;
db.person.save(hombre);
});
http://docs.mongodb.org/manual/reference/method/cursor.snapshot/
J'ai essayé la solution ci-dessus, mais je l'ai trouvée inappropriée pour de grandes quantités de données. J'ai ensuite découvert la fonctionnalité de flux:
MongoClient.connect("...", function(err, db){
var c = db.collection('yourCollection');
var s = c.find({/* your query */}).stream();
s.on('data', function(doc){
c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
});
s.on('end', function(){
// stream can end before all your updates do if you have a lot
})
})
Concernant ceci réponse , la fonction de capture instantanée est obsolète dans la version 3.6, d’après pdate . Ainsi, à partir de la version 3.6, il est possible d'effectuer l'opération de la manière suivante:
db.person.find().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
Voici ce que nous avons proposé pour copier un champ dans un autre pour environ 150_000 enregistrements. Cela a pris environ 6 minutes, mais consomme beaucoup moins de ressources que s'il avait instancié et itéré sur le même nombre d'objets Ruby.
js_query = %({
$or : [
{
'settings.mobile_notifications' : { $exists : false },
'settings.mobile_admin_notifications' : { $exists : false }
}
]
})
js_for_each = %(function(user) {
if (!user.settings.hasOwnProperty('mobile_notifications')) {
user.settings.mobile_notifications = user.settings.email_notifications;
}
if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
}
db.users.save(user);
})
js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
À partir de _Mongo 4.2
_, db.collection.update()
peut accepter un pipeline d'agrégation, permettant enfin la mise à jour/la création d'un champ basé sur un autre champ:
_// { firstName: "Hello", lastName: "World" }
db.collection.update(
{},
[{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
{ multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
_
La première partie _{}
_ est la requête de correspondance, filtrant les documents à mettre à jour (dans notre cas, tous les documents).
La deuxième partie _[{ $set: { name: { ... } }]
_ est le pipeline d'agrégation de mises à jour (notez les crochets qui indiquent l'utilisation d'un pipeline d'agrégation). $set
est un nouvel opérateur d'agrégation et un alias de _$addFields
_.
N'oubliez pas _{ multi: true }
_, sinon seul le premier document correspondant sera mis à jour.