Mis a jour le 2024-10-20, 20:16

Lecture de pdf

On peut utiliser le package pdfplumber, surtout intéressant pour récupérer des tableaux à partir d'un pdf.
Pour ouvrir un fichier :
Propriété des objets Page :
myPage.chars :
myPage.lines :
myPage.rects :
myPage.curves :
Transformer une page en image :
On peut ainsi extraire les images :
Extraction des tables (par analyse des lignes de séparation et aussi de l'alignment des mots :
Dans un pdf :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert