Mon entrée est simplement un fichier csv avec 339732 lignes et deux colonnes:
J'essaie de former mes données sur un modèle LSTM empilé:
data_dim = 29
timesteps = 8
num_classes = 2
model = Sequential()
model.add(LSTM(30, return_sequences=True,
input_shape=(timesteps, data_dim))) # returns a sequence of vectors of dimension 30
model.add(LSTM(30, return_sequences=True)) # returns a sequence of vectors of dimension 30
model.add(LSTM(30)) # return a single vector of dimension 30
model.add(Dense(1, activation='softmax'))
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
model.summary()
model.fit(X_train, y_train, batch_size = 400, epochs = 20, verbose = 1)
Cela jette l'erreur:
Traceback (appel le plus récent en dernier): Fichier "first_approach.py", ligne 80, dans model.fit (X_train, y_train, batch_size = 400, epochs = 20, verbose = 1)
ValueError: erreur lors de la vérification de l'entrée du modèle: lstm_1_input devrait avoir 3 dimensions, mais un tableau avec une forme (339732, 29)
J'ai essayé de remodeler mon entrée en utilisant X_train.reshape((1,339732, 29))
mais cela n'a pas fonctionné en affichant l'erreur:
ValueError: erreur lors de la vérification de l'entrée du modèle: lstm_1_input devrait avoir une forme (Aucune, 8, 29) mais un tableau avec une forme (1, 339732, 29)
Comment puis-je alimenter mon entrée dans le LSTM?
Réglage timesteps = 1
(depuis, je veux un pas de temps pour chaque instance) et reformer le X_train et le X_test en tant que:
import numpy as np
X_train = np.reshape(X_train, (X_train.shape[0], 1, X_train.shape[1]))
X_test = np.reshape(X_test, (X_test.shape[0], 1, X_test.shape[1]))
Cela a fonctionné!
Pour timesteps != 1
, vous pouvez utiliser la fonction ci-dessous (adapté de here )
import numpy as np
def create_dataset(dataset, look_back=1):
dataX, dataY = [], []
for i in range(len(dataset)-look_back+1):
a = dataset[i:(i+look_back), :]
dataX.append(a)
dataY.append(dataset[i + look_back - 1, :])
return np.array(dataX), np.array(dataY)
Exemples
X = np.reshape(range(30),(3,10)).transpose()
array([[ 0, 10, 20],
[ 1, 11, 21],
[ 2, 12, 22],
[ 3, 13, 23],
[ 4, 14, 24],
[ 5, 15, 25],
[ 6, 16, 26],
[ 7, 17, 27],
[ 8, 18, 28],
[ 9, 19, 29]])
create_dataset(X, look_back=1 )
(array([[[ 0, 10, 20]],
[[ 1, 11, 21]],
[[ 2, 12, 22]],
[[ 3, 13, 23]],
[[ 4, 14, 24]],
[[ 5, 15, 25]],
[[ 6, 16, 26]],
[[ 7, 17, 27]],
[[ 8, 18, 28]],
[[ 9, 19, 29]]]),
array([[ 0, 10, 20],
[ 1, 11, 21],
[ 2, 12, 22],
[ 3, 13, 23],
[ 4, 14, 24],
[ 5, 15, 25],
[ 6, 16, 26],
[ 7, 17, 27],
[ 8, 18, 28],
[ 9, 19, 29]]))
create_dataset(X, look_back=3)
(array([[[ 0, 10, 20],
[ 1, 11, 21],
[ 2, 12, 22]],
[[ 1, 11, 21],
[ 2, 12, 22],
[ 3, 13, 23]],
[[ 2, 12, 22],
[ 3, 13, 23],
[ 4, 14, 24]],
[[ 3, 13, 23],
[ 4, 14, 24],
[ 5, 15, 25]],
[[ 4, 14, 24],
[ 5, 15, 25],
[ 6, 16, 26]],
[[ 5, 15, 25],
[ 6, 16, 26],
[ 7, 17, 27]],
[[ 6, 16, 26],
[ 7, 17, 27],
[ 8, 18, 28]],
[[ 7, 17, 27],
[ 8, 18, 28],
[ 9, 19, 29]]]),
array([[ 2, 12, 22],
[ 3, 13, 23],
[ 4, 14, 24],
[ 5, 15, 25],
[ 6, 16, 26],
[ 7, 17, 27],
[ 8, 18, 28],
[ 9, 19, 29]]))
Remodeler l'entrée pour LSTM:
X = array([[10, 20, 30], [40, 50, 60], [70, 80, 90]])
X_train = X.reshape(1, 3, 3) # X.reshape(samples, timesteps, features)