J'ai un site interne (intranet) composé de plusieurs blogs et forums, de centaines de pages statiques, de nombreux fichiers PDF et de plusieurs autres types de documents. Il a été collé de manière lâche ces deux dernières années et c’est maintenant à moi de le maintenir.
Je cherche un moteur de recherche que je peux héberger moi-même idéalement:
Permet de rechercher directement les bases de données Blog/Forum si les informations de la base de données et les tables à rechercher lui sont données.
Traite la plupart des documents texte (PDF/DOC/ODF)
Est open source, ou permet l'accès au code source une fois acheté
La langue ou la plate-forme dans laquelle il est écrit n'a pas d'importance. Normalement, j'utilise simplement la recherche sur les sites de Google, mais ce n'est pas une option pour un intranet.
Départ Lucene
Écrit en Java également disponible pour le . NET Framework
Voici un article CodeProject qui explique comment cela fonctionne et comment il est utilisé. http://www.codeproject.com/KB/library/IntroducingLucene.aspx
J'ai déjà utilisé Sphider auparavant et j'ai été assez impressionné.
SearchBlox qui est basé sur Lucene pourra peut-être répondre à vos besoins. C'est gratuit et vient avec un robot.
Normalement, j'utilisais simplement la recherche sur les sites Google, mais ce n'est pas une option pour un intranet.
Il existe en effet le système de recherche Google qui est l’équivalent de la recherche d’intranets sur les sites de Google. Cependant, il ne s’agit pas d’une source ouverte (la recherche de site Google ne l’est pas non plus, au cas où vous ne l’auriez pas remarqué.)