Je recherche un serveur de recherche en texte intégral autonome doté des propriétés suivantes:
Les alternatives que j'ai trouvées qui ont ces propriétés sont:
Mes questions:
J'utilise Solr avec succès depuis près de 2 ans maintenant et je n'ai jamais utilisé Sphinx. Je suis donc manifestement partial. Cependant, je vais essayer de rester objectif en citant les docs ou d’autres personnes. Je vais aussi prendre des correctifs à ma réponse :-)
Similitudes:
Voici quelques différences:
Java -jar start.jar
). Sphinx n'a pas de configuration supplémentaire.Questions connexes:
Sphinx est votre meilleur choix, à moins que vous n'ayez besoin d'étendre la fonctionnalité de recherche de manière propriétaire.
Les avantages du Sphinx:
Solr avantages:
Remarque: de nombreux utilisateurs ont la même question à l'esprit.
Donc, pour répondre à la question:
Lequel et pourquoi?
Utilisez Solr si vous avez l’intention de l’utiliser dans votre application Web (exemple de moteur de recherche de site). Ce sera certainement génial, grâce à son API. Vous aurez certainement besoin de ce pouvoir pour une application Web.
Utilisez Sphinx si vous souhaitez effectuer une recherche très rapide dans des tonnes de documents/fichiers. Il indexe très vite aussi. Je recommanderais de ne pas l'utiliser dans une application impliquant JSON ou l'analyse XML pour obtenir les résultats de la recherche. Utilisez-le pour des recherches directes en dB. Cela fonctionne très bien sur MySQL.
Alternatives
Bien que ce soient les géants, il y en a beaucoup plus. De plus, certains utilisent ces outils pour alimenter leurs infrastructures personnalisées. Donc, je dirais que vous n'en avez vraiment manqué. Bien qu'il y ait un elasticsearch qui a une bonne base d'utilisateurs.
J'utilise Sphinx depuis presque un an maintenant et c'était incroyable. Je peux indexer 1,5 million de documents en une minute environ sur mon MacBook et encore plus rapidement sur le serveur. J'utilise également Sphinx pour limiter les recherches à des endroits situés sous des latitudes et des longitudes spécifiques, et c'est très rapide. En outre, le classement des résultats est très modifiable. Facile à installer et à configurer, si vous lisez un tutoriel ou deux. Presque 1,0 statut, mais leurs candidats à la libération ont été solides.
Lucene/Solr semble être plus en vedette et avec de plus longues années d'activité et une communauté d'utilisateurs beaucoup plus forte. À mon humble avis, si vous parvenez à surmonter les problèmes de configuration initiaux que certains semblent avoir rencontrés (pas nous), je dirais alors que Lucene/Solr est votre meilleur choix.