Est-il possible de pivoter des données à l'aide de LINQ?

Question

Je me demande s'il est possible d'utiliser LINQ pour faire pivoter des données à partir de la présentation suivante:

CustID | OrderDate | Qty 1 | 1/1/2008 | 100 2 | 1/2/2008 | 200 1 | 2/2/2008 | 350 2 | 2/28/2008 | 221 1 | 3/12/2008 | 250 2 | 3/15/2008 | 2150

dans quelque chose comme ça:

CustID | Jan- 2008 | Feb- 2008 | Mar - 2008 | 1 | 100 | 350 | 250 2 | 200 | 221 | 2150

Amy B · Accepted Answer

Quelque chose comme ça?

List<CustData> myList = GetCustData(); var query = myList .GroupBy(c => c.CustId) .Select(g => new { CustId = g.Key, Jan = g.Where(c => c.OrderDate.Month == 1).Sum(c => c.Qty), Feb = g.Where(c => c.OrderDate.Month == 2).Sum(c => c.Qty), March = g.Where(c => c.OrderDate.Month == 3).Sum(c => c.Qty) });

GroupBy dans Linq ne fonctionne pas de la même manière que SQL. En SQL, vous obtenez la clé et les agrégats (forme de ligne/colonne). Dans Linq, vous obtenez la clé et tous les éléments en tant qu'enfants de la clé (forme hiérarchique). Pour pivoter, vous devez projeter la hiérarchie dans un formulaire de ligne/colonne de votre choix.

Sanjaya.Tio · Answer

J'ai répondu question similaire en utilisant la méthode d'extension linq:

// order s(ource) by OrderDate to have proper column ordering var r = s.Pivot3(e => e.custID, e => e.OrderDate.ToString("MMM-yyyy") , lst => lst.Sum(e => e.Qty)); // order r(esult) by CustID

(+) implémentation générique
(-) nettement plus lent que David B.

Quelqu'un peut-il améliorer mon implémentation (c'est-à-dire que la méthode ordonne les colonnes et les lignes)?

Enigmativity · Answer

La meilleure approche pour cela, je pense, consiste à utiliser une recherche:

var query = from c in myList group c by c.CustId into gcs let lookup = gcs.ToLookup(y => y.OrderDate.Month, y => y.Qty) select new { CustId = gcs.Key, Jan = lookup[1].Sum(), Feb = lookup[2].Sum(), Mar = lookup[3].Sum(), };

Vitaliy Fedorchenko · Answer

Voici un moyen un peu plus générique de faire pivoter des données à l'aide de LINQ:

IEnumerable<CustData> s; var groupedData = s.ToLookup( k => new ValueKey( k.CustID, // 1st dimension String.Format("{0}-{1}", k.OrderDate.Month, k.OrderDate.Year // 2nd dimension ) ) ); var rowKeys = groupedData.Select(g => (int)g.Key.DimKeys[0]).Distinct().OrderBy(k=>k); var columnKeys = groupedData.Select(g => (string)g.Key.DimKeys[1]).Distinct().OrderBy(k=>k); foreach (var row in rowKeys) { Console.Write("CustID {0}: ", row); foreach (var column in columnKeys) { Console.Write("{0:####} ", groupedData[new ValueKey(row,column)].Sum(r=>r.Qty) ); } Console.WriteLine(); }

où ValueKey est une classe spéciale représentant une clé multidimensionnelle:

public sealed class ValueKey { public readonly object[] DimKeys; public ValueKey(params object[] dimKeys) { DimKeys = dimKeys; } public override int GetHashCode() { if (DimKeys==null) return 0; int hashCode = DimKeys.Length; for (int i = 0; i < DimKeys.Length; i++) { hashCode ^= DimKeys[i].GetHashCode(); } return hashCode; } public override bool Equals(object obj) { if ( obj==null || !(obj is ValueKey)) return false; var x = DimKeys; var y = ((ValueKey)obj).DimKeys; if (ReferenceEquals(x,y)) return true; if (x.Length!=y.Length) return false; for (int i = 0; i < x.Length; i++) { if (!x[i].Equals(y[i])) return false; } return true; } }

Cette approche peut être utilisée pour regrouper par N-dimensions (n> 2) et fonctionnera correctement pour des ensembles de données plutôt petits. Pour les grands ensembles de données (jusqu'à 1 million d'enregistrements et plus) ou pour les cas où la configuration de pivot ne peut pas être codée en dur, j'ai écrit une bibliothèque spéciale PivotData (c'est gratuit):

var pvtData = new PivotData(new []{"CustID","OrderDate"}, new SumAggregatorFactory("Qty")); pvtData.ProcessData(s, (o, f) => { var custData = (TT)o; switch (f) { case "CustID": return custData.CustID; case "OrderDate": return String.Format("{0}-{1}", custData.OrderDate.Month, custData.OrderDate.Year); case "Qty": return custData.Qty; } return null; } ); Console.WriteLine( pvtData[1, "1-2008"].Value );

Ali Bayat · Answer

C'est le moyen le plus efficace:

Vérifiez l'approche suivante. Au lieu de parcourir le groupe de clients chaque fois pour chaque mois.

var query = myList .GroupBy(c => c.CustId) .Select(g => { var results = new CustomerStatistics(); foreach (var customer in g) { switch (customer.OrderDate.Month) { case 1: results.Jan += customer.Qty; break; case 2: results.Feb += customer.Qty; break; case 3: results.March += customer.Qty; break; default: break; } } return new { CustId = g.Key, results.Jan, results.Feb, results.March }; });

Ou celui-ci:

var query = myList .GroupBy(c => c.CustId) .Select(g => { var results = g.Aggregate(new CustomerStatistics(), (result, customer) => result.Accumulate(customer), customerStatistics => customerStatistics.Compute()); return new { CustId = g.Key, results.Jan, results.Feb, results.March }; });

Solution complète:

using System; using System.Collections.Generic; using System.Linq; namespace ConsoleApp { internal class Program { private static void Main(string[] args) { IEnumerable<CustData> myList = GetCustData().Take(100); var query = myList .GroupBy(c => c.CustId) .Select(g => { CustomerStatistics results = g.Aggregate(new CustomerStatistics(), (result, customer) => result.Accumulate(customer), customerStatistics => customerStatistics.Compute()); return new { CustId = g.Key, results.Jan, results.Feb, results.March }; }); Console.ReadKey(); } private static IEnumerable<CustData> GetCustData() { Random random = new Random(); int custId = 0; while (true) { custId++; yield return new CustData { CustId = custId, OrderDate = new DateTime(2018, random.Next(1, 4), 1), Qty = random.Next(1, 50) }; } } } public class CustData { public int CustId { get; set; } public DateTime OrderDate { get; set; } public int Qty { get; set; } } public class CustomerStatistics { public int Jan { get; set; } public int Feb { get; set; } public int March { get; set; } internal CustomerStatistics Accumulate(CustData customer) { switch (customer.OrderDate.Month) { case 1: Jan += customer.Qty; break; case 2: Feb += customer.Qty; break; case 3: March += customer.Qty; break; default: break; } return this; } public CustomerStatistics Compute() { return this; } } }