J'implémente une structure d'apprentissage automatique pour essayer de prédire la fraude sur les systèmes financiers comme les banques, etc. Cela signifie qu'il y a beaucoup de données différentes qui peuvent être utilisées pour former le modèle, par exemple. numéro de carte, nom du titulaire de la carte, montant, pays, etc ...
J'ai du mal à décider quelle structure est la meilleure pour ce problème. J'ai une certaine expérience avec les arbres de décision mais actuellement, j'ai commencé à me demander si un réseau neuronal serait mieux pour ce type de problème. Aussi, si une autre méthode serait la meilleure, n'hésitez pas à m'éclairer.
Quels sont les avantages et les inconvénients de chaque structure et quelle structure serait la meilleure pour ce problème?
De plus, je ne suis pas sûr de ce fait, mais je pense que les arbres de décision ont un grand avantage sur les réseaux de neurones en termes de vitesse d'exécution. Ceci est important car la vitesse est également un facteur clé dans ce projet.
Il existe de nombreuses différences entre ces deux, mais en termes pratiques, il y a trois choses principales à considérer: la vitesse, l'interprétabilité et la précision.
Arbres de décision
Réseaux neuronaux
Vous voudrez peut-être essayer d'implémenter les deux et d'exécuter des expériences sur vos données pour voir laquelle est la meilleure et comparer les temps d'exécution. Ou, vous pouvez utiliser quelque chose comme le Weka GUI pris avec un échantillon représentatif de vos données pour tester les deux méthodes.
Il se peut également que l'utilisation d'algorithmes de "bagging" ou de "boosting" avec des arbres de décision améliore la précision tout en conservant une certaine simplicité et vitesse. Mais en bref, si la vitesse et l'interprétabilité sont vraiment importantes, alors les arbres sont probablement par où commencer. Sinon, cela dépend et vous aurez une exploration empirique à faire.