Accueil > Le P’tit Usania > 2023 > 297 - Mai 2023 > 297.4 - Océriser des documents avec pdf24.org

297.4 - Océriser des documents avec pdf24.org

Christophe Prévot

dimanche 7 mai 2023, par Bertrand Maujean

En 2018 je vous présentais l’application Adobe Scan pour tablette et téléphone Android ou iOS qui permet de rapidement prendre en photo des textes imprimés et de les océriser, c’est-à-dire d’effectuer une reconnaissance de caractères ce qui permet une recherche en plain-texte, copier-coller du texte, etc. (voir : Prévot Chr. (2018) - « Un outil pour bibliophile : Adobe Scan », Le P’tit Usania n° 240, Usan, Nancy, p. 2-3). L’outil est simple et rapide à mettre en œuvre, mais la qualité de l’image reste moyenne, notamment au niveau du cadrage, du fait d’une prise de photographie « à main levée ».

Une autre solution pour avoir un document propre est de privilégier un scanneur à plat pour ensuite faire éventuellement des retouches via un logiciel de retouches photographiques. C’est plus long, plus fastidieux, mais le document obtenu est de bien meilleure qualité. Reste alors à océriser le document ce qui nécessite un logiciel spécifique souvent payant et à nouveau beaucoup de temps devant soi...

Le site internet pdf24.org propose un tel outil en ligne gratuitement ! Il suffit de disposer d’une image d’un document imprimé (numérisation à plat ou photo) et d’effectuer les bons réglages pour obtenir une reconnaissance de caractères tout à fait satisfaisante (suivant la qualité de l’image il y aura des erreurs mais le résultat est là).

Petit tutoriel :

  • Aller dans les outils (Tools) du site pdf24.org.

  • Choisir l’outil OCR PDF.

  • Déposer (par glisser-coller ou par sélection) le fichier en format image ou PDF qui doit être océrisé. Il est possible de déposer plusieurs fichiers.

  • Choisir la langue d’origine du document (si plusieurs fichiers sont déposés il faut qu’ils soient dans la même langue), régler le type de sortie à PDF/A et cocher « Forcer l’OCR » puis lancer la reconnaissance.

  • Après le temps nécessaire au travail (ce qui peut être long…) il est alors possible de télécharger le résultat (un ou plusieurs fichiers PDF) qui contient en fond visuel le document déposé et en surcouche l’océrisation.

Le site propose également plein d’autres fonctionnalités ; c’est un véritable couteau suisse pour fichiers PDF !

Et si jamais la liaison internet ne permet pas ce type de travail, le site propose le logiciel PDF24 Creator à télécharger et installer sur un ordinateur (malheureusement version Windows uniquement) et qui inclut cette fonctionnalité.

Un message, un commentaire ?

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par un administrateur du site.

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.

Lien hypertexte

(Si votre message se réfère à un article publié sur le Web, ou à une page fournissant plus d’informations, vous pouvez indiquer ci-après le titre de la page et son adresse.)