web-dev-qa-db-fra.com

Comment multiplier un scalaire à travers une colonne spécifique dans un tableau NumPy?

J'ai besoin de faire une analyse sur un grand ensemble de données à partir d'un travail de terrain en hydrolégologie. J'utilise NumPy. Je veux savoir comment je peux:

  1. multiplier par exemple la 2ème colonne de mon tableau par un numéro (par exemple 5.2). Puis

  2. calculer la somme cumulée des nombres de cette colonne.

Comme je l'ai mentionné, je veux uniquement travailler sur une colonne spécifique et non sur l'ensemble du tableau.

24
Mary Jane
 you can do this in two simple steps using NumPy:

>>> # multiply column 2 of the 2D array, A, by 5.2
>>> A[:,1] *= 5.2

>>> # assuming by 'cumulative sum' you meant the 'reduced' sum:
>>> A[:,1].sum()

>>> # if in fact you want the cumulative sum (ie, returns a new column)
>>> # then do this for the second step instead:
>>> NP.cumsum(A[:,1])

avec quelques données moquées:

>>> A = NP.random.Rand(8, 5)
>>> A
  array([[ 0.893,  0.824,  0.438,  0.284,  0.892],
         [ 0.534,  0.11 ,  0.409,  0.555,  0.96 ],
         [ 0.671,  0.817,  0.636,  0.522,  0.867],
         [ 0.752,  0.688,  0.142,  0.793,  0.716],
         [ 0.276,  0.818,  0.904,  0.767,  0.443],
         [ 0.57 ,  0.159,  0.144,  0.439,  0.747],
         [ 0.705,  0.793,  0.575,  0.507,  0.956],
         [ 0.322,  0.713,  0.963,  0.037,  0.509]])

>>> A[:,1] *= 5.2

>>> A
  array([[ 0.893,  4.287,  0.438,  0.284,  0.892],
         [ 0.534,  0.571,  0.409,  0.555,  0.96 ],
         [ 0.671,  4.25 ,  0.636,  0.522,  0.867],
         [ 0.752,  3.576,  0.142,  0.793,  0.716],
         [ 0.276,  4.255,  0.904,  0.767,  0.443],
         [ 0.57 ,  0.827,  0.144,  0.439,  0.747],
         [ 0.705,  4.122,  0.575,  0.507,  0.956],
         [ 0.322,  3.71 ,  0.963,  0.037,  0.509]])

>>> A[:,1].sum()
  25.596156138451427

quelques règles simples sont nécessaires pour effectuer la sélection d'éléments (indexation) dans NumPy:

  • NumPy, comme Python, est basé sur 0, donc par exemple, le "1" ci-dessous se réfère à la deuxième colonne

  • des virgules séparent les dimensions à l'intérieur des crochets, donc [lignes, colonnes], par exemple, A [2,3] signifie l'élément ("cellule") à la ligne trois, colonne quatre

  • un deux-points signifie tous des éléments le long de cette dimension, par exemple, A [:, 1] crée une vue de la colonne 2 de A; A [3 ,:] fait référence à la quatrième ligne

31
doug

Sûr:

import numpy as np
# Let a be some 2d array; here we just use dummy data 
# to illustrate the method
a = np.ones((10,5))
# Multiply just the 2nd column by 5.2 in-place
a[:,1] *= 5.2

# Now get the cumulative sum of just that column
csum = np.cumsum(a[:,1])

Si vous ne voulez pas le faire sur place, vous aurez besoin d'une stratégie légèrement différente:

b = 5.2*a[:,1]
csum = np.cumsum(b)
6
JoshAdel

Pour multiplier une constante avec une colonne ou une ligne spécifique:

import numpy as np;
X=np.ones(shape=(10,10),dtype=np.float64);
X;

### this is our default matrix
array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
   [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])



 ## now say we want to multiple it with 10

 X=X*10;

array([[10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
   [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.]])

### Now if, we want to mulitply 3,5, 7 column with 5

X[:,[3,5,7]]=X[:,[3,5,7]]*5

 array([[10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.],
   [10., 10., 10., 50., 10., 50., 10., 50., 10., 10.]])

De même, nous pouvons le faire pour toutes les colonnes. J'espère que cela clarifie.

0
Yogesh Sanchihar