Les partenaires publicitaires:

Comment analyser les documents pdf en java

des fichiers PDF vous fournir un format standard pour programmation ouverte et analyser des données à partir d'un document en lecture seule. Vous pouvez utiliser les bibliothèques PDF Java pour ouvrir un document et de lire les informations contenues dans. Vous pouvez soit stocker ces informations dans une base de données ou d'afficher les informations vers le lecteur dans votre application Java.

Instructions

  1. droit; cliquez sur le fichier Java que vous souhaitez utiliser pour analyser les informations au format PDF. Cliquez "Ouvrir Avec" et sélectionnez votre éditeur Java.

  2. Importez la bibliothèque du lecteur de PDF. Ajoutez le code suivant au début de votre fichier Java pour importer la bibliothèque:

    com.asprise.util.pdf.PDFReader importation;



  3. Ouvrez le fichier PDF. L'analyseur est situé dans la "PDFReader" classe dans la bibliothèque que vous venez d'ajouter. Ajoutez le code suivant à la fonction que vous souhaitez utiliser pour analyser le fichier, en remplaçant "thepdf.pdf" avec votre propre nom de fichier PDF:

    PDFReader pdf = new PDFReader (new File ("thepdf.pdf")) -
    pdf.open ();




  4. Analyser le texte à partir du fichier PDF. Le code suivant analyse le contenu de la première page dans le PDF:

    Chaîne pdfcontent = pdf.extractTextFromPage (0);

    Remplacez le "0" avec le numéro de page que vous souhaitez extraire du fichier. La première page commence à 0, de sorte que chaque page index supplémentaire est le numéro de la page que vous voulez extraire moins 1 pour compenser le décalage.

  5. Fermez le fichier après avoir terminé l'analyse des données. Le code suivant ferme le fichier:

    pdf.close ();

» » » » Comment analyser les documents pdf en java