J'ai la liste d'objets bs4 suivante:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
Je veux extraire le HTML brut comme une chaîne. J'ai essayé:
>>> a = listing.contents
>>> type(a)
<type 'list'>
Donc ça ne marche pas. Comment puis-je faire ceci?
Obtenez juste le représentation sous forme de chaîne :
html_content = str(listing)
Ceci est une version non prettified.
Si vous voulez une version plus jolie, utilisez la méthode prettify()
:
html_content = listing.prettify()