J'essaie de jouer avec certaines données en ligne et j'ai du mal à les représenter en raison d'une erreur 'Attribute' dans la fonction de tracé.
# Reading data from an online data sets
import pandas as pd
import requests, zipfile, StringIO
r = requests.get('https://archive.ics.uci.edu/ml/machine-learning-databases/00287/Activity Recognition from Single Chest-Mounted Accelerometer.Zip')
z = zipfile.ZipFile(StringIO.StringIO(r.content))
activity_files = [name for name in z.namelist() if name.endswith('.csv')]
# Loading it to a pandas dataframe
z_data = z.read(activity_files[4]).split('\n')
activity_data = pd.DataFrame([z.split(',') for z in z_data], columns=('Seq','Ax','Ay','Az','Label'))
# Filtering
working_desk_data = activity_data[activity_data.Label == '1']
standing_data = activity_data[activity_data.Label == '3']
walking_data = activity_data[activity_data.Label == '4']
# Plotting
plt.plot(walking_data['Seq'], walking_data['Ax']) # <--- Error
plt.plot(walking_data['Seq'], walking_data['Ay']) # <--- Error
plt.plot(walking_data['Seq'], walking_data['Az']) # <--- Error
plt.show()
Des solutions de contournement ou de me diriger dans la bonne direction seraient utiles? Je peux tracer ce qui suit, alors je me trompe clairement au-dessus de quelque chose.
plt.plot(range(1,5), [1,2,1,2])
plt.show()
Edit: (Ajout de données pour Julien Spronck)
walking_data.head()
Out[12]:
Seq Ax Ay Az Label
22950 22950 1978 2386 1988 4
22951 22951 1977 2387 1990 4
22952 22952 1983 2390 1994 4
22953 22953 1978 2396 1994 4
22954 22954 1980 2387 1992 4
walking_data.columns
Out[79]:
Index([u'Seq', u'Ax', u'Ay', u'Az', u'Label'], dtype='object')
In [80]:
type(walking_data.Seq)
Out[80]:
pandas.core.series.Series
In [81]:
type(walking_data.Ax)
Out[81]:
pandas.core.series.Series
plot
devient confus parce que vous lui passez des chaînes , pas des chiffres. Si vous les convertissez en (disons) float
s:
walking_data = walking_data.astype(float)
Ensuite, vous aurez
Utilisez la méthode DataFrame plot :
walking_data.plot('Seq', ,'Ax')