La conversion d'un fichier PDF en fichier Ms-Word est une demande qui est exprimée par de nombreux utilisateurs. Il est vrai que les outils d'Adobe ne sont pas très performants dans ce domaine. Cette "lacune" s'explique au regard des motivations qui ont amené Adobe à developper le format de fichier PDF et les outils qui vont avec: rendre des documents (fichiers) développés dans des applications professionnelles visualisables dans n'importe quels environnements, indépendemment de caractéristiques de ceux-ci (OS, couleurs, résolution, mprimante...). Dans ce programme, il n'a jamais été prévu de permettre de retravailler le document PDF.
Ce qui semble évident pour les graphistes, l'est beaucoup moins pour les employés de bureau qui continuent à rêver de la réutilisation des fichiers PDF dans leur Ms-Word. Plusieurs éditeurs ont flairé la bonne affaire et se sont engoufrés dans la brèche.
A l'occasion d'une mission pour un client, j'ai été amené à réaliser une telle conversion (PDF -> Word). Cela m'a donné une raison de procéder à quelques tests de sélection de logiciels, à l'issue desquels mon choix s'est porté sur VeryPDF PDF2Word v3.0 (http://www.verypdf.com). Je ne prétend pas que c'est le meilleur des meilleurs, toutefois, c'est celui qui a livré les documents Word les plus proches (layout) du document PDF, tout en ne compliquant pas trop la structure du document Word. Il est vrai que les autres applications testées, soit passaient par un processus d'OCR, soit avaient un recours forcené aux blocs de texte, ce qui rend la réutilisation du document texte très complexe.
Ce qui ne gâche rien, c'est que son prix est raisonnable, soit 39,95 USD. Même pour une utilisation unique, le jeu en vaux la chandelle.
Il y a de nombreuses années qu'on évoque l'utilisation du format PDF comme format d'archivage. En fait, l'ISO (Organisation Internationale de normalisation) a publié, en octobre 2005, la norme ISO 19055 qui "
définit un format de fichier des documents électroniques pour une conservation à long terme". En d'autres termes, depuis près de 2 ans, le format PDF/A est considéré comme un format d'archivage recommandé.
Qu'est-ce qui fait la différence entre le format PDF et le PDF/A? En fait, l'objectif de cette norme était d'assurer le reproductivité des fichiers PDF dans le long terme, ce qui signifie notamment que:
- tous les producteurs de fichiers PDF/A doivent respecter le format PDF 1.4 et l'implémenter de la même manière
- le fichier doit être indépendant des technologies, et donc éviter tout particularisme lié à un OS, un écran, une imprimante...
- le fichier doit contenir toute l'information du document, et donc ne pas contenir de liens vers l'extérieur
- le fichier doit contenir sa propre description
- le fichier ne peut être protégé
Dans les faits, cela signifie que les fichiers PDF/A-1 doivent:
- inclure toutes les polices de caractères
- utiliser un espace colorimétrique indépendant
- inclure des metadata XMP
Mais ne peuvent pas inclure:
- du cryptage
- de compression avec l'algorythme LZW
- des fichiers inclus
- des références externes
- de la transparence PDF
- des éléments multimedia
- du javascript
Pour plus d'information, voici quelques documents de référence: