Puis-je effectuer cette conversion avec n'importe quel langage de programmation ou bibliothèque?
La réponse courte est oui, cela peut être fait dans n'importe quel langage de programmation.
Étapes de base:
Quelques sites Web pour vous aider à démarrer:
Juin 2015 Remarque: Le validateur epubcheck est passé du code google à GitHub; notez la nouvelle URL.
Calibre prend en charge une grande variété de formats d'entrée, y compris HTML, et une grande variété de formats de sortie, y compris EPUB, mais ce n'est pas "un langage de programmation ou une bibliothèque". Y a-t-il des raisons spécifiques pour lesquelles vous désirez une approche basée sur la programmation plutôt qu'un outil autonome? Si tel est le cas, peut-être que Python et ebookmaker.py , par exemple, pourrait vous aider.
Une réponse tardive, mais j'ai trouvé que la valeur Python 3-based ebookmaker était utile, au moins après avoir envoyé une demande d'extraction pour supprimer une nomenclature UTF-8. Un problème avec cela semble être qu'il utilise expressions régulières fragiles pour analyser HTML , mais je suppose que je devrai le signaler là-bas.
J'utilise la bibliothèque suivante d'Aspose - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx
En seulement deux lignes de code, je suis capable de faire des conversions html en epub. Utilisant ceci actuellement dans un système de production.
Document doc = nouveau document (_sourceFilePath);
doc.Save (_destinationFilePath, SaveFormat.Epub);
Je viens de commencer à implémenter un tel outil dans Java (compatible OpenJDK): html2epub . Afin de me débarrasser de l'édition manuelle du fichier de configuration, je vais probablement commencer un outil distinct pour générer le fichier de configuration à partir de n'importe quel répertoire donné (cependant, il serait toujours nécessaire de déterminer l'ordre des XHTML dans l'EPUB - pour une utilisation non programmatique, le développement d'un outil d'aide GUI pourrait être envisagé, pour une flexibilité totale Je n'ai pas encore trouvé d'idée.) Avant cela, j'ai implémenté des convertisseurs basés sur des scripts Shell pour une entrée XML personnalisée ( outils hag2epub ) - au cas où vous seriez intéressé, je le ferais probablement les porter sur l'entrée XHTML (avec un fichier de configuration pour les métadonnées EPUB ou obtenir des métadonnées à partir du plus haut index.html d'un répertoire, s'il existe).
Voici pdf to epub , je sais que ce n'est pas ce que vous recherchez, mais c'est un début.
Le package calibre peut avoir ce que vous voulez
J'ai déjà rencontré le même problème, car je souhaite lire du contenu de page Web hors ligne sur mon iPad. Je n'en ai aucune idée et je ne suis pas un connaisseur en informatique. Il y a du calibre ou de la strophe blabla ....
Mais pour moi, ce ne sont que des convertisseurs de formats et j'ai besoin d'un créateur de livre ePub qui me permettra de combiner de nombreux documents souhaités à lire. Ensuite, j'ai trouvé un bookish convertisseur html en ePub , j'enregistre la page html du Web puis la convertis avec. C'est un très bon outil pour moi maintenant.