web-dev-qa-db-fra.com

Erreur Matplotlib/Pandas en utilisant un histogramme

J'ai du mal à créer des histogrammes à partir d'objets de la série pandas et je ne comprends pas pourquoi cela ne fonctionne pas. Le code a bien fonctionné auparavant, mais maintenant il ne fonctionne pas.

Voici un peu de mon code (plus précisément, un objet de la série pandas dont je tente de créer un histogramme):

type(dfj2_MARKET1['VSPD2_perc'])

qui produit le résultat: pandas.core.series.Series

Voici mon code de tracé:

fig, axes = plt.subplots(1, 7, figsize=(30,4))
axes[0].hist(dfj2_MARKET1['VSPD1_perc'],alpha=0.9, color='blue')
axes[0].grid(True)
axes[0].set_title(MARKET1 + '  5-40 km / h')

Message d'erreur:

    AttributeError                            Traceback (most recent call last)
    <ipython-input-75-3810c361db30> in <module>()
      1 fig, axes = plt.subplots(1, 7, figsize=(30,4))
      2 
    ----> 3 axes[1].hist(dfj2_MARKET1['VSPD2_perc'],alpha=0.9, color='blue')
      4 axes[1].grid(True)
      5 axes[1].set_xlabel('Time spent [%]')

    C:\Python27\lib\site-packages\matplotlib\axes.pyc in hist(self, x, bins, range, normed,          weights, cumulative, bottom, histtype, align, orientation, rwidth, log, color, label,    stacked, **kwargs)
   8322             # this will automatically overwrite bins,
   8323             # so that each histogram uses the same bins
-> 8324             m, bins = np.histogram(x[i], bins, weights=w[i], **hist_kwargs)
   8325             m = m.astype(float) # causes problems later if it's an int
   8326             if mlast is None:

    C:\Python27\lib\site-packages\numpy\lib\function_base.pyc in histogram(a, bins, range,     normed, weights, density)
    158         if (mn > mx):
    159             raise AttributeError(
--> 160                 'max must be larger than min in range parameter.')
    161 
    162     if not iterable(bins):

AttributeError: max must be larger than min in range parameter.
61
jonas

Cette erreur se produit notamment lorsque vous avez des valeurs NaN dans la série. Cela pourrait-il être le cas?

Ces NaN ne sont pas bien gérés par la fonction hist de matplotlib. Par exemple:

s = pd.Series([1,2,3,2,2,3,5,2,3,2,np.nan])
fig, ax = plt.subplots()
ax.hist(s, alpha=0.9, color='blue')

produit la même erreur AttributeError: max must be larger than min in range parameter. Une option consiste par exemple à supprimer les NaN avant de tracer. Cela fonctionnera:

ax.hist(s.dropna(), alpha=0.9, color='blue')

Une autre option consiste à utiliser la méthode pandas hist sur votre série et à fournir le axes[0] au mot clé ax:

dfj2_MARKET1['VSPD1_perc'].hist(ax=axes[0], alpha=0.9, color='blue')
110
joris

L'erreur est due à juste titre aux valeurs de NaN comme expliqué ci-dessus. Il suffit d'utiliser df = df ['nom_colonne']. Appliquer (pd.to_numeric) si la valeur n'est pas numérique, puis appliquer - df = df ['nom_colonne']. np.nan, your_value) .

0
brainhack