Je suis nouveau aux pandas et au python. Mes données d'entrée sont comme
category text
1 hello iam fine. how are you
1 iam good. how are you doing.
inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]
ici, Y est l’objet de la série panda, que je veux convertir en tableau numpy. donc j'ai essayé .as_matrix
YArray= Y.as_matrix(columns=None)
print YArray
Mais j’ai obtenu le résultat sous la forme [1,1] (ce qui est faux car je n’ai qu’une catégorie de colonne et deux lignes). Je veux le résultat sous forme de matrice 2x1.
Essaye ça:
après avoir appliqué le .as_matrix sur votre objet de série
Y.reshape((2,1))
Comme .as_matrix () ne retourne qu’un tableau numpy, PAS une matrice numpy . Lien ici
Pour obtenir numpy tableau, vous avez besoin
Y.values
Si df est votre cadre de données, une colonne de celui-ci est une série et doit être convertie en tableau,
df = pd.DataFrame()
x = df.values
print(x.type)
Les tirages suivants,
<class 'numpy.ndarray'>
convertir avec succès en un tableau.