
Erreur de fusion estivale Tensorflow: la forme [-1,784] a des dimensions négatives

J'essaie d'obtenir un résumé du processus de formation du réseau neuronal ci-dessous.

import tensorflow as tf 
import numpy as np 

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets(".\MNIST",one_hot=True)

# Create the model
def train_and_test(hidden1,hidden2, learning_rate, epochs, batch_size):

    with tf.name_scope("first_layer"):
        input_data = tf.placeholder(tf.float32, [batch_size, 784], name = "input")
        weights1  = tf.Variable(
        tf.random_normal(shape =[784, hidden1],stddev=0.1),name = "weights")
        bias = tf.Variable(tf.constant(0.0,shape =[hidden1]), name = "bias")
        activation = tf.nn.relu(
        tf.matmul(input_data, weights1) + bias, name = "relu_act")
        tf.summary.histogram("first_activation", activation)

    with tf.name_scope("second_layer"):
        weights2  = tf.Variable(
        tf.random_normal(shape =[hidden1, hidden2],stddev=0.1),
        name = "weights")
        bias2 = tf.Variable(tf.constant(0.0,shape =[hidden2]), name = "bias")
        activation2 = tf.nn.relu(
        tf.matmul(activation, weights2) + bias2, name = "relu_act")
        tf.summary.histogram("second_activation", activation2)

    with tf.name_scope("output_layer"):
        weights3 = tf.Variable(
            tf.random_normal(shape=[hidden2, 10],stddev=0.5), name = "weights")
        bias3 = tf.Variable(tf.constant(1.0, shape =[10]), name = "bias")
        output = tf.add(
        tf.matmul(activation2, weights3, name = "mul"), bias3, name = "output")
        tf.summary.histogram("output_activation", output)
    y_ = tf.placeholder(tf.float32, [batch_size, 10])

    with tf.name_scope("loss"):
        cross_entropy = tf.reduce_mean(
        tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=output))
        tf.summary.scalar("cross_entropy", cross_entropy)
    with tf.name_scope("train"):
        train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(cross_entropy)

    with tf.name_scope("tests"):
        correct_prediction = tf.equal(tf.argmax(output, 1), tf.argmax(y_, 1))
        accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    summary_op = tf.summary.merge_all()

    sess = tf.InteractiveSession()
    writer = tf.summary.FileWriter("./data", sess.graph)

    # Train
    for i in range(epochs):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
         _, summary = sess.run([train_step,summary_op], feed_dict={input_data: batch_xs, y_: batch_ys})

     if i % 10 ==0:
          test_xs, test_ys = mnist.train.next_batch(batch_size)
          test_accuracy = sess.run(accuracy, feed_dict = {input_data : test_xs, y_ : test_ys})
    return test_accuracy

if __=="__main__":
print(train_and_test(500, 200, 0.001, 10000, 100))

Je teste le modèle toutes les 10 étapes avec un lot aléatoire de données de test ..___ Le problème réside dans le sommateur. Le sess.run () à l'intérieur de la boucle for lève l'erreur suivante.

    Traceback (most recent call last):

InvalidArgumentError (see above for traceback): Shape [-1,784] has negative dimensions
     [[Node: first_layer_5/input = Placeholder[dtype=DT_FLOAT, shape=[?,784], _device="/job:localhost/replica:0/task:0/cpu:0"]()]]

Si je supprime tous les rédacteurs de résumé et résumé, le modèle fonctionne correctement . Pouvez-vous m'aider à localiser le problème ici? J'ai essayé de manipuler les formes de tenseurs mais je n'ai abouti à rien.


D'un commentaire de la réponse supprimée, de l'affiche originale:

En fait, je construis un réseau neuronal sous with tf.Graph() as g. J'ai supprimé la session interactive et commencé la session en tant que with tf.Session(g) as sess. Cela a résolu le problème.

Le graphe g n'était pas marqué comme le graphe par défaut de cette façon, ainsi la session (tf.InteractiveSession dans le code d'origine) utiliserait un autre graphe à la place.

Notez que je suis tombé sur ici à cause du même message d'erreur. Dans mon cas, j'avais accidentellement quelque chose comme ceci:

input_data = tf.placeholder(tf.float32, shape=(None, 50))
input_data = tf.tanh(input_data)
session.run(..., feed_dict={input_data: ...})

C'est à dire. Je n'ai pas nourri l'espace réservé. Il semble que certaines autres opérations de tenseurs puissent alors entraîner cette erreur déroutante, car une dimension indéfinie est représentée en interne par -1.


J'avais aussi ce problème. Rechercher dans le consensus de base consiste à rechercher des problèmes ailleurs dans votre code.

Ce qui a réglé le problème pour moi, c'est que je faisais une sess.run(summary_op) sans alimenter les données de mes espaces réservés. 

Tensorflow semble être un peu étrange avec les espaces réservés. Souvent, ils ne voudront pas que vous ne les alimentiez pas si vous essayez d'évaluer une partie du graphique qui en est indépendante. Ici cependant, il l'a fait.


Cela a peut-être à voir avec l'initialisation InteractiveSession.

Je l'ai initialisé au début, puis cela a fonctionné, puis les variables globales ont été initialisées dans la session.

Je ne peux pas reproduire l'erreur avec l'ancien code, ce qui le rend imprévisible ou met en cache les paramètres quelque part.

import tensorflow as tf
sess = tf.InteractiveSession()

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

x = tf.placeholder(tf.float32, [None, 784])

W = tf.Variable(tf.zeros([784,10]))

b = tf.Variable(tf.zeros([10]))

y = tf.nn.softmax(tf.matmul(x, W)+b)

y_ = tf.placeholder(tf.float32, [None,10])

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.05).minimize(cross_entropy)

for _ in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    #print batch_xs.shape, batch_ys.shape
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})