web-dev-qa-db-fra.com

comment aplatir une liste 2D en 1D sans utiliser numpy?

J'ai une liste qui ressemble à ceci:

[[1,2,3],[1,2],[1,4,5,6,7]]

et je veux l'aplatir en [1,2,3,1,2,1,4,5,6,7]

existe-t-il une fonction légère pour le faire sans utiliser numpy?

26
wakeupbuddy

Sans numpy ( ndarray.flatten ) vous pouvez utiliser chain.from_iterable qui est un constructeur alternatif pour itertools.chain:

>>> list(chain.from_iterable([[1,2,3],[1,2],[1,4,5,6,7]]))
[1, 2, 3, 1, 2, 1, 4, 5, 6, 7]

vous pouvez également utiliser reduce dans python 2 et functools.reduce en 3 qui est plus efficace pour les listes courtes (ne l'utilisez pas pour les listes longues):

In [4]: from functools import reduce # Python3

In [5]: reduce(lambda x,y :x+y ,[[1,2,3],[1,2],[1,4,5,6,7]])
Out[5]: [1, 2, 3, 1, 2, 1, 4, 5, 6, 7]

Ou comme moyen un peu plus rapide, utilisez operator.add au lieu d'un lambda:

In [6]: from operator import add

In [7]: reduce(add ,[[1,2,3],[1,2],[1,4,5,6,7]])
Out[7]: [1, 2, 3, 1, 2, 1, 4, 5, 6, 7]

In [8]: %timeit reduce(lambda x,y :x+y ,[[1,2,3],[1,2],[1,4,5,6,7]])
789 ns ± 7.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

In [9]: %timeit reduce(add ,[[1,2,3],[1,2],[1,4,5,6,7]])
635 ns ± 4.38 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

Ou comme une autre approche encore pythonique, vous pouvez utiliser une compréhension de liste :

[j for sub in [[1,2,3],[1,2],[1,4,5,6,7]] for j in sub]

référence:

:~$ python -m timeit "from itertools import chain;chain.from_iterable([[1,2,3],[1,2],[1,4,5,6,7]])"
1000000 loops, best of 3: 1.58 usec per loop
:~$ python -m timeit "reduce(lambda x,y :x+y ,[[1,2,3],[1,2],[1,4,5,6,7]])"
1000000 loops, best of 3: 0.791 usec per loop
:~$ python -m timeit "[j for i in [[1,2,3],[1,2],[1,4,5,6,7]] for j in i]"
1000000 loops, best of 3: 0.784 usec per loop

Un benchmark sur la réponse de @ Will qui utilisait sum (c'est rapide pour la liste courte mais pas pour la liste longue):

:~$ python -m timeit "sum([[1,2,3],[4,5,6],[7,8,9]], [])"
1000000 loops, best of 3: 0.575 usec per loop
:~$ python -m timeit "sum([range(100),range(100)], [])"
100000 loops, best of 3: 2.27 usec per loop
:~$ python -m timeit "reduce(lambda x,y :x+y ,[range(100),range(100)])"
100000 loops, best of 3: 2.1 usec per loop
48
Kasramvd

Pour une liste comme celle-ci, ma petite astuce préférée consiste simplement à utiliser sum;

sum a un argument optionnel: sum(iterable [, start]), vous pouvez donc faire:

list_of_lists = [[1,2,3], [4,5,6], [7,8,9]]
print sum(list_of_lists, []) # [1,2,3,4,5,6,7,8,9]

cela fonctionne parce que le + L'opérateur se trouve être l'opérateur de concaténation des listes, et vous lui avez dit que la valeur de départ est [] - une liste vide.

mais la documentation de sum vous conseille d'utiliser itertools.chain à la place, car c'est beaucoup plus clair.

32
will

Cela fonctionnera dans votre cas particulier. Une fonction récursive fonctionnerait mieux si vous avez plusieurs niveaux d'itérables imbriqués.

def flatten(input):
    new_list = []
    for i in input:
        for j in i:
            new_list.append(j)
    return new_list
0
AlexMayle