web-dev-qa-db-fra.com

Qu'est-ce que preprocessing.scale () fait? Comment ça marche?

Python 3.5, prétraitement depuis sklearn

df = quandl.get('WIKI/GOOGL')
X = np.array(df)
X = preprocessing.scale(X)
5
0x Tps

L'algorithme preprocessing.scale () place vos données sur une échelle. Ceci est utile avec des jeux de données en grande partie clairsemés. En termes simples, vos données sont très dispersées. Par exemple, les valeurs de X peuvent ressembler à ceci: 

X = [1, 4, 400, 10 000, 100 000]

Le problème avec la parcimonie est qu’il est très biaisé ou en termes statistiques biaisés. Par conséquent, la mise à l'échelle des données regroupe toutes vos valeurs sur une seule échelle, éliminant ainsi la fragmentation. Pour ce qui est de savoir comment cela fonctionne dans les détails mathématiques, cela suit le même concept de normalisation et de normalisation. Vous pouvez faire des recherches sur ceux-ci pour savoir comment cela fonctionne en détail. Mais pour vous simplifier la vie, l'algorithme sklearn fait tout pour vous!

8
Deepak M

La mise à l'échelle des données rassemble toutes vos valeurs sur une seule échelle, éliminant ainsi la parcimonie et suivant le même concept de normalisation et de normalisation. Pour voir l'effet, vous pouvez appeler décrire sur le bloc de données avant et après le traitement:

df.describe()

#with X is already pre-proccessed 
df2 = pandas.DataFrame(X)
df2.describe()

Vous verrez que df2 a 0 moyenne et la variation standard de 1 dans chaque champ.

0
T D Nguyen