J'ai du mal à créer des histogrammes à partir d'objets de la série pandas et je ne comprends pas pourquoi cela ne fonctionne pas. Le code a bien fonctionné auparavant, mais maintenant il ne fonctionne pas.
Voici un peu de mon code (plus précisément, un objet de la série pandas dont je tente de créer un histogramme):
type(dfj2_MARKET1['VSPD2_perc'])
qui produit le résultat: pandas.core.series.Series
Voici mon code de tracé:
fig, axes = plt.subplots(1, 7, figsize=(30,4))
axes[0].hist(dfj2_MARKET1['VSPD1_perc'],alpha=0.9, color='blue')
axes[0].grid(True)
axes[0].set_title(MARKET1 + ' 5-40 km / h')
Message d'erreur:
AttributeError Traceback (most recent call last)
<ipython-input-75-3810c361db30> in <module>()
1 fig, axes = plt.subplots(1, 7, figsize=(30,4))
2
----> 3 axes[1].hist(dfj2_MARKET1['VSPD2_perc'],alpha=0.9, color='blue')
4 axes[1].grid(True)
5 axes[1].set_xlabel('Time spent [%]')
C:\Python27\lib\site-packages\matplotlib\axes.pyc in hist(self, x, bins, range, normed, weights, cumulative, bottom, histtype, align, orientation, rwidth, log, color, label, stacked, **kwargs)
8322 # this will automatically overwrite bins,
8323 # so that each histogram uses the same bins
-> 8324 m, bins = np.histogram(x[i], bins, weights=w[i], **hist_kwargs)
8325 m = m.astype(float) # causes problems later if it's an int
8326 if mlast is None:
C:\Python27\lib\site-packages\numpy\lib\function_base.pyc in histogram(a, bins, range, normed, weights, density)
158 if (mn > mx):
159 raise AttributeError(
--> 160 'max must be larger than min in range parameter.')
161
162 if not iterable(bins):
AttributeError: max must be larger than min in range parameter.
Cette erreur se produit notamment lorsque vous avez des valeurs NaN dans la série. Cela pourrait-il être le cas?
Ces NaN ne sont pas bien gérés par la fonction hist
de matplotlib. Par exemple:
s = pd.Series([1,2,3,2,2,3,5,2,3,2,np.nan])
fig, ax = plt.subplots()
ax.hist(s, alpha=0.9, color='blue')
produit la même erreur AttributeError: max must be larger than min in range parameter.
Une option consiste par exemple à supprimer les NaN avant de tracer. Cela fonctionnera:
ax.hist(s.dropna(), alpha=0.9, color='blue')
Une autre option consiste à utiliser la méthode pandas hist
sur votre série et à fournir le axes[0]
au mot clé ax
:
dfj2_MARKET1['VSPD1_perc'].hist(ax=axes[0], alpha=0.9, color='blue')
L'erreur est due à juste titre aux valeurs de NaN comme expliqué ci-dessus. Il suffit d'utiliser df = df ['nom_colonne']. Appliquer (pd.to_numeric) si la valeur n'est pas numérique, puis appliquer - df = df ['nom_colonne']. np.nan, your_value) .