web-dev-qa-db-fra.com

pandas créer une série avec n éléments (séquentiels ou randbetween)

J'essaie de créer une série pandas.

Une colonne de la série doit contenir n nombres séquentiels. [1, 2, 3, ..., n]

Une colonne doit contenir des nombres aléatoires entre k et k+100.

Une colonne doit contenir une sélection aléatoire entre les chaînes d'une liste. ['A', 'B', 'C', ... 'Z']

8
becinyus

Il peut y avoir beaucoup de solutions. Dans les commentaires du bloc de code (#) vous trouverez quelques liens pour plus d'informations:

import pandas as pd
import numpy as np
import random
import string

k = 5
N = 10

#http://docs.scipy.org/doc/numpy/reference/generated/numpy.random.randint.html
#http://stackoverflow.com/a/2257449/2901002

df = pd.DataFrame({ 'A' : range(1, N + 1 ,1),
    'B' : np.random.randint(k, k + 100 , size=N),
    'C' : pd.Series(random.choice(string.ascii_uppercase) for _ in range(N)) })

print df
#    A   B  C
#0   1  60  O
#1   2  94  L
#2   3  10  W
#3   4  94  X
#4   5  60  O
#5   6  20  K
#6   7  58  Y
#7   8  40  I
#8   9  49  X
#9  10  65  S

Numpy solution:

import pandas as pd
import numpy as np

k = 5
N = 10

alphabet = list('ABCDEFGHIJKLMNOPQRSTUVWXYZ')

#http://docs.scipy.org/doc/numpy/reference/generated/numpy.random.choice.html

df = pd.DataFrame({ 'A' : range(1, N + 1 ,1),
    'B' : np.random.randint(k, k + 100 , size=N),
    'C' : np.random.choice(np.array(alphabet, dtype="|S1"), N) })

print df
#    A    B  C
#0   1   16  U
#1   2   76  X
#2   3  101  N
#3   4   61  F
#4   5   52  J
#5   6   62  A
#6   7   99  L
#7   8   23  N
#8   9   75  D
#9  10   16  Q
8
jezrael
import pandas
n = 30
k = 40
pandas.DataFrame([(i, random.randint(k, k+100), chr(random.randint(ord('A'), ord('Z')))) for i in xrange(0, n)

Si vous voulez vous spécifiez les noms de colonne sinon il est réglé sur 0,1,2

3
Tom Ron