Bonjour, je travaille sur la version Simplicité version6.2.7.
J’ai crée des objets DocumentDB contenant des pièces jointes de type PDF. J’aimerai en extraire le contenu dans un String depuis le backend. J’ai vu dans la documentation l’objet SimplePDFBoxAdapter mais je n’en comprends pas l’utilisation.
Pouvez-vous m’indiquer comment extraire le texte de mon objet DocumentDB de type pdf dans un String (peut être avec un exemple?) ? Merci à l’avance
SimplePDFBoxAdapter s’utilise comme tout adapter en surchargeant la classe et en implémentant les hooks dont vous avez besoin, en l’occurrence:
/**
* Processing PDF document information
* @param info Map of document information items
*/
protected void processInfo(Map<String, String> info) throws PlatformException, InterruptedException
/**
* Processing PDF document form field
* @param name Form field name
* @param value Form field string value
*/
protected void processField(String name, String value) throws PlatformException, InterruptedException
/**
* Processing PDF document embedded file
* @param filename File name
* @param value Embedded file content input stream
*/
protected void processEmbeddedFile(String filename, InputStream in) throws PlatformException, InterruptedException
/**
* Processing PDF document test content
* @param content Text content
*/
protected void processTextContent(String content) throws PlatformException, InterruptedException
PS: s’il s’agit de “simplement” extraire le contenu textuel d’un PDF nous pouvons sans doute ajouter et backporter en 6.2 des méthodes ad hoc qui font ça dans la classe helper PDFTool, ça évite de passer par un adapter dont la vocation première est de servir d’injecteur de données, pas juste de lire des fichiers.
DocumentDB doc = ...;
String text = PDFTool.getText(doc.getBytes(true)); // if doc content is not loaded
// or
String text = PDFTool.getText(doc.getBytes()); // if doc content is already loaded
Ce sera livré dans la prochaine révision de la 6.2 (6.2.8)