ScanLivreDemander un devis
Livres et lecture — bureau avec documents
Retour à l’accueil

Formats de scan & livrables

PDF, EPUB, OCR et DPI — selon votre usage

Choisissez votre rendu : PDF fidèle pour l’archive, EPUB pour la lecture sur liseuse, et OCR pour rendre le texte recher­chable. Le tout est cadré au devis (y compris les exports dataset si besoin).

Ebooks liseuses

EPUB reflowable, EPUB FXL, Kindle (MOBI/AZW3).

PDF & OCR

PDF recherchable + OCR multilingue.

DPI (résolution)

200 à 600 DPI, ajusté au support et au besoin.

Dataset

Structuration & exports pour vos outils (CSV/JSON/SQL).

Formats de fichier proposés

Chaque famille de format répond à un besoin différent : pérennité, édition, poids du fichier ou interopérabilité avec vos outils.

PDF & archivage

Le PDF reste le format le plus universel pour partager et archiver. Le PDF/A est pensé pour la conservation à long terme : couleurs et polices mieux figées dans le temps. Le PDF avec OCR ajoute une couche de texte invisible : vous cherchez un mot comme dans un document Word, tout en gardant l’apparence de la page d’origine.

  • PDF
  • PDF/A
  • PDF recherchable (OCR intégré)

Image & presse-papiers

Le TIFF convient lorsqu’il faut conserver un maximum d’information par pixel (retouche, chaîne graphique, archives image). Les variantes LZW, JPEG intégré ou CCITT G4 équilibrent taille de fichier et usage (noir et blanc, fax, plans). JPG et PNG sont adaptés au web, aux aperçus rapides ou aux illustrations à partager.

  • TIFF (non compressé / RAW)
  • TIFF LZW
  • TIFF JPEG
  • TIFF CCITT G4 (fax / noir & blanc)
  • JPG
  • PNG

Texte & bureautique

Après OCR, le contenu peut être réexporté vers Word, Excel ou PowerPoint pour retravailler un texte, un tableau ou une présentation. TXT, RTF et HTML servent aux chaînes légères, sites ou outils qui consomment du texte brut. La qualité dépend toujours de la netteté du document source et du type d’écriture (imprimé, machine à écrire, manuscrit).

  • TXT
  • RTF
  • HTML
  • Word — DOC / DOCX
  • Excel — XLS / XLSX
  • PowerPoint — PPT / PPTX

Ebooks & liseuses

L’EPUB est le format le plus répandu pour les liseuses et applis de lecture (Apple Livres, Kobo, etc.) : le texte issu de l’OCR peut être structuré (titres, chapitres) pour un rendu qui s’adapte à la taille de l’écran, aux polices et aux marges — idéal pour un livre imprimé net. L’EPUB à mise en page fixe (FXL) se rapproche d’une « photo de page » numérique : utile pour les magazines très illustrés ou les ouvrages où la composition compte autant que le texte. Les formats MOBI ou AZW3 visent surtout l’écosystème Kindle ; on les produit en général par conversion depuis l’EPUB ou via une chaîne adaptée, selon votre appareil. Un PDF haute définition reste souvent le meilleur compromis si vous voulez conserver exactement l’apparence du papier, avec zoom. La qualité d’un ebook « texte » suit celle de l’OCR : imprimé ou dactylographié clair d’abord ; manuscrits denses, annotations ou papier très dégradé impliquent une relecture ou des attentes réalistes sur les erreurs résiduelles.

  • EPUB 3 — texte reflowable
  • EPUB 3 — mise en page fixe (FXL)
  • MOBI / AZW3 — usage Kindle
  • PDF — page fidèle à l’imprimé

Données & web (souvent avec option dataset)

Pour les projets données (inventaires, bases, intégration logicielle), les exports XML, JSON ou SQL sont définis avec vous : structure des champs, encodage, conventions de nommage. Cela s’articule en général avec l’option base de données / dataset après numérisation et OCR.

  • XML
  • JSON
  • SQL
  • HTML structuré

Liste indicative : le périmètre exact (notamment XML, JSON, SQL, détail EPUB / Kindle) est validé au devis, en lien avec l’option dataset si besoin.

Ebooks : choisir entre EPUB, PDF et Kindle

En complément du bloc « Ebooks & liseuses » ci-dessus, voici comment trancher selon votre usage — sans engagement technique de votre côté : on le formalise au devis.

Comparaison des débouchés ebook après numérisation
LivrableIntérêt principal
EPUB reflowableLecture confortable, taille de police, mode nuit sur liseuse ou tablette.
EPUB FXLPages proches du magazine ou de l’album imprimé.
PDFFidélité à la page, partage universel, archivage.
MOBI / AZW3Lecture sur liseuses et applis Amazon Kindle.

Au devis, nous précisons le type d’EPUB (reflowable ou FXL), les métadonnées souhaitées (titre, auteur, langue) et si vous ciblez une liseuse précise — cela évite les allers-retours après livraison.

Pour un usage strictement privé, l’ebook personnel issu de votre propre exemplaire papier relève en principe du même cadre que la copie privée ; pour toute diffusion, republication ou plateforme commerciale, vous restez responsable des droits sur l’œuvre et des autorisations nécessaires.

Résolution (DPI)

La résolution fixe combien de points image sont capturés par pouce du document. Plus elle est élevée, plus vous conservez de détail pour le zoom ou l’impression ; plus elle est modérée, plus les fichiers restent légers pour la consultation quotidienne. Nous pouvons numériser selon les paliers suivants, en les adaptant au type de support et à votre objectif.

600 DPI

Très haute définition — zoom fort, conservation exigeante

400 DPI

Équilibre qualité / volume pour beaucoup d’usages pro

300 DPI

Standard courant pour l’impression et la lecture écran

200 DPI

Fichiers plus légers, consultation rapide sur tablette ou web

OCR & langues

L’OCR (reconnaissance optique de caractères) transforme l’image des caractères en texte sélectionnable et recherchable. Il alimente les PDF « recherchables », les exports Word ou Excel, la fabrication d’EPUB pour liseuses, et les projets dataset.

Le moteur couvre une très large palette de langues (plus de 180, jusqu’à environ 185 selon le moteur et le document), dont le français et les langues européennes les plus courantes.

La qualité finale dépend du contraste, de la netteté, du papier jauni ou glacé, et surtout du type d’écriture : texte imprimé ou dactylographié donne en général de meilleurs résultats que l’écriture manuscrite dense ou les annotations au crayon.

Formats physiques & tailles

Nous pouvons traiter, dans un même projet si besoin, des documents de tailles variées — du format A5 aux très grands formats (A0 et au-delà), selon la nature du support (livre, plan, affiche, registre) et la faisabilité technique. La confirmation se fait toujours avant devis : photo, dimensions approximatives, état du document.

Exemples de formats papier courants
FamilleExemples
Courant bureauA4, A3, lettre US
CompactA5, brochures, petits registres
Grands formatsA2, A1, A0, affiches, plans
Reliés & épaisLivres, magazines, thèses, catalogues

Exemples de documents que nous numérisons

Liste non exhaustive — décrivez votre support : nous confirmons la faisabilité et les formats de sortie adaptés.

  • Livres

  • Magazines

  • Journaux & presse

  • Documents de bureau

  • Documents A4 et A3

  • Grands documents A0, A1, A2

  • Posters

  • Plans de construction

  • Dessins CAO / CAD

  • Cartes

  • GIS

  • Catalogues

  • Dictionnaires

  • Documents juridiques

  • Dossiers médicaux

  • Registres & archives

  • Livres pour EPUB / liseuse

Un projet précis en tête ?

Indiquez les formats souhaités et l’usage visé : nous proposons une combinaison cohérente (DPI, PDF, EPUB, OCR, exports).

Demander un devis
Demander un devis