( Weka est probablement la bibliothèque d'apprentissage automatique la plus populaire. Mais cela peut être assez lent dans mon expérience.
J'ai regardé ( Requin , Gaufres , dlib , Plearn et MLC++ comme alternatives. Parmi ceux-ci, Shark et dlib semblent les plus prometteurs.
Quelqu'un a-t-il une expérience en matière de test de performances de ces bibliothèques?
Pour moi, ce qui importe le plus serait "Est-ce que cette boîte à outils possède l'algorithme ou la fonctionnalité que je veux essayer?" Étant donné que ces boîtes à outils fournissent un ensemble assez varié de fonctionnalités, vous devez d'abord essayer de restreindre ce que vous voulez faire.
Ainsi, par exemple, si vous avez un désir ardent d'essayer différents algorithmes d'optimisation évolutive, j'irais avec quelque chose comme Shark .
D'un autre côté, je préfère dlib pour la plupart de mes travaux, mais cela ne veut pas forcément dire grand-chose, car je l'ai écrit :) Cependant, si vous êtes intéressé par la classification binaire, laissez-moi vous suggérer ma méthode préférée actuelle pour cela, le svm_c_ekm_trainer . Je l'utilise fréquemment pour entraîner des SVM non linéaires sur des ensembles de données de centaines de milliers de points. Il s'exécute généralement en quelques minutes (ou parfois même quelques secondes) tandis que l'algorithme SMO classique pour cela prendrait des heures ou des jours.
Il y avait aussi quelques bonnes réponses à une question similaire posée il n'y a pas si longtemps: Quelle bibliothèque de machine learning utiliser .