Je pense que le titre est explicite, mais pour l'expliquer plus en détail, il existe la méthode train_test_split()
de sklearn qui fonctionne comme suit: X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.3, stratify = Y)
Cela signifie: la méthode divisera les données avec un rapport de 0,3: 0,7 et essaiera d'égaler le pourcentage d'étiquettes dans les deux données. Y a-t-il un équivalent keras de cela?
Malheureusement, la réponse ( malgré notre souhait ) est non! Certains jeux de données existants, tels que MNIST, etc., peuvent être chargés directement:
(X_train, y_train), (X_test, y_test) = mnist.load_data()
Ce chargement direct de manière fractionnée donne de faux espoirs d'avoir une méthode générale, mais malheureusement, ce n'est pas présent ici, bien que vous soyez peut-être intéressé par l'utilisation des wrappers pour SciKit-Learn sur Keras .
Il y a presque question similaire sur DataScience SE