> Modules non standards > Autres modules non standards > Beautiful Soup pour le parsing HTML
Beautiful Soup pour le parsing HTML
Beautiful Soup : package pour parser facilement, avec un parseur de type DOM, un document html, même mal formé (pas forcément XHTML).
Utilisation du package : from bs4 import BeautifulSoup.
Construction de l'objet :
- à partir du texte : text = '<html><body><div class="myList" id="myId"><ul>Une liste :<li>item1</li><li>item2</li></ul></div><div>un autre paragraphe.</div></body></html>'; doc = BeautifulSoup(text, 'html.parser')
- ou sinon, à partir d'un filehandle : doc = BeautifulSoup(fh, 'html.parser').
Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert