J'ai un jeu de données avec des milliers d'éléments et leurs fréquences respectives. Je dois tracer un histogramme des 10 principaux éléments.
J'ai fait:
top_words = Counter(my_data).most_common()
top_words_10 = top_words[:10]
plt.hist(top_words_10,label='True')
et j'ai cette erreur:
TypeError
Traceback (most recent call last)
<ipython-input-29-ff974b3a2354> in <module>()
5 print top_words[:10]
6
----> 7 plt.hist(top_words_10)
C:\Anaconda\lib\site-packages\numpy\core\_methods.pyc in _amin(a, axis, out, keepdims)
12 def _amin(a, axis=None, out=None, keepdims=False):
13 return um.minimum.reduce(a, axis=axis,
---> 14 out=out, keepdims=keepdims)
15
16 def _sum(a, axis=None, dtype=None, out=None, keepdims=False):
TypeError: cannot perform reduce with flexible type
Une idée?? mes données ressemble à ceci:
[(' whitefield', 65299), (' bellandur', 57061), (' kundalahalli', 51769), (' marathahalli', 50639), (' electronic city', 44041), (' sarjapur road junction', 34164), (' indiranagar 2nd stage', 32459), (' malleswaram', 32171), (' yelahanka main road', 28901), (' domlur', 28869)]
Vous obtenez cette erreur car vous devez convertir vos données en un type numérique. Votre tableau contient des chaînes.
import matplotlib.pyplot as plt
import numpy as np
data = [(' whitefield', 65299), (' bellandur', 57061), (' kundalahalli', 51769), (' marathahalli', 50639),
(' electronic city', 44041), (' sarjapur road junction', 34164), (' indiranagar 2nd stage', 32459),
(' malleswaram', 32171), (' yelahanka main road', 28901), (' domlur', 28869)]
freequency = []
words = []
for line in data:
freequency.append(line[1])
words.append(line[0])
y_axis = np.arange(1, len(words) + 1, 1)
plt.barh(y_axis, freequency, align='center')
plt.yticks(y_axis, words)
plt.show()
Le problème est que plt.hist
tente d'utiliser nmupy.hist
pour créer un histogramme à partir des données que vous transmettez.
Vous voulez simplement utiliser bar
import matplotlib.pyplot as plt
fig, ax = plt.subplots(1, 1)
words, counts = Zip(*data32) # unpack pairs into two lists
ax.bar(range(len(counts)), words, align='center')
ax.set_xticks(range(len(counts))
ax.set_xticklabels(words) # this is about the _only_ use for set_xticklabels
plt.draw
Voir cet exemple et la documentation .