Scroll to navigation

PDFTK(1) Manuel de l'utilisateur Linux PDFTK(1)

NOM

pdftk - Un outil pratique de manipulation de fichiers PDF

SYNOPSIS

pdftk <fichiers PDF d'entrée | - | PROMPT>
[input_pw <mots de passe du PDF d'entrée | PROMPT>]
[<opération> <arguments d'opération>]
[output <nom du fichier de sortie | - | PROMPT>]
[encrypt_40bit | encrypt_128bit]
[allow <permissions>]
[owner_pw <mot de passe du propriétaire | PROMPT>]
[user_pw <mot de passe de l'utilisateur | PROMPT>]
[flatten] [compress | uncompress]
[keep_first_id | keep_final_id] [drop_xfa]
[verbose] [dont_ask | do_ask]
Où:
<opération> peut être vide, ou :
[cat | attach_files | unpack_files | burst |
fill_form | background | stamp | generate_fdf
dump_data | dump_data_fields | update_info]

Pour une aide complète : pdftk --help

DESCRIPTION

Si le format PDF était un papier électronique, pdftk serait un "retire-agrafe", troueur, classeur, un anneau de décodage secret et des lunettes à rayons X. Pdftk est un outil simple pour manipuler tous les jours des documents PDF. Utilisez-le pour :

* Fusionner des documents PDF
* Diviser des pages PDF dans un nouveau document
* Faire pivoter des documents/pages PDF
* Décrypter des entrées comme bon vous semble (mot de passe requis)
* Chiffrer les sorties comme vous le voulez
* Remplir des formulaires PDF avec X/PDF ou des formulaires bidimensionnels
* Générer FDF Data Stencil depuis un formulaire PDF
* Appliquer un fond d'écran Watermark ou un traitement tampon
* Signaler les conversions PDF comme les métadonnées et les signets
* Mettre à jour des metadonnées PDF
* Ajouter des fichiers aux pages PDF ou au document PDF
* Extraire les fichiers joints PDF
* Diviser un document PDF en plusieurs pages
* Décompresser et recompresser des flots de pages
* Réparer les PDF corrompus (quand c'est possible)

OPTIONS

Une sélection d'options est incluse ci-dessous.

Montre un résumé des options.
<fichiers PDF d'entrée | - | PROMPT>
Une liste de fichiers PDF en entrée. Si vous voulez combiner les PDF (sans utiliser de queues), listez les fichiers dans l'ordre où vous voulez qu'ils soient combinés. Utilisez - pour passer un seul PDF avec pdftk via l'entrée standard. Les fichiers en entrée peuvent être associés à un descripteur, où le descripteur est une simple lettre majuscule :

<descripteur du PDF d'entrée>=<nom du fichier PDF d'entrée>

Les descripteurs sont souvent omis. Ils sont utiles quand on spécifie un mot de passe ou des séries de pages, plus tard.

Par exemple: A=input1.pdf B=input2.pdf

[input_pw <propre mot de passe du PDF d'entrée| PROMPT>]
Les mot de passe propriétaires d'entrée, si nécessaire, sont associés avec les fichiers en utilisant leurs descripteurs.

<descripteur du PDF d'entrée>=<code personnel d'accès au ficher PDF d'entrée>

Si les descripteurs ne sont pas donnés, les mots de passe sont associés avec les fichiers d'entrée en ordre.

La plupart des options de pdftk nécessitent que les entrées PDF soient accompagnées du mot de passe "propriétaire". Si ce PDF n'a pas de mot de passe propriétaire, il faudra donner le mot de passe "utilisateur". Si le PDF d'entrée n'a pas de mot de passe, aucun mot de passe ne devra être donné.

Quand le mode do_ask est activé, pdftk vous demandera un mot de passe si le mot de passe donné est incorrect ou qu'aucun mot de passe n'a été donné.

[<opération> <arguments d'opération>]
Si cet argument optionnel est oublié, pdftk se lance en mode 'filter'. Ce mode ne prend qu'un PDF en entrée et crée un autre fichier PDF après avoir effectué toutes les options de sortie, comme l'encodage et la compression.

Les commandes disponibles sont : cat, attach_files, unpack_files, burst, fill_form, background, stamp, dump_data, dump_data_fields, generate_fdf, update_info. Quelques commandes prennent un argument supplémentaire, comme décrit ci-dessous.

Concatène des pages depuis des pdf en entrée afin de créer un nouveau PDF. L'ordre d'affichage de la page dans le nouveau PDF est specifié par l'ordre donné précedemment. L'ordonnement des pages est décrit comme ceci :

<descripteur du PDF d'entrée>[<numéro de page de début>[-<numéro de page de fin>[<qualificatif>]]][<sens de la page>]

Les endroits où le descripteur identifie l'un des PDF d'entrée, ainsi que le numéro de page sont référencés à partir de 1 dans les pages du fichier PDF, et le qualificateur peut être pair ou impair, et la rotation peut être N, S, E, W, L, R, ou D.

Si le descripteur n'est pas mis pour la série de pages, les pages sont prises depuis le premier PDF en entrée.

Le qualificateur pair a pour effet que pdftk n'utilise que les pages du PDF numérotées paires, 1-6even produira les pages 2, 4 et 6 dans cet ordre. 6-1even produira les pages 6, 4 et 2 dans cet ordre.

Les qualificateurs pair et impairXS agissent de la même façon.

Les réglages de rotation peuvent provoquer la rotation des pages et des documents. Chaque option définit la rotation de la page comme suit N: 0, E: 90, S: 180, W: 270, L: -90, R: +90, D: +180. L, R, et D effectue les ajustements relatifs à la rotation de la page.

Si aucun argument n'est donné à cat, le pdftk va combiner tous les fichiers PDF en entrée dans l'ordre où ils ont été donnés pour créer le fichier de sortie.

NOTES :

* <Le nombre de pages final> peut être moindre que <le nombre de pages du début>. * Le mot clé end peut être utilisé pour référencer la dernière page du document à la place d'un numéro de page

* Référencer une seule page en omettant le numéro de la page de fin.

* Le descripteur peut être utilisé seul pour représenter le document PDF en entier par exemple Bl-end est le même que B.

1-endE - Pivoter l'intégralité d'un document de 90 degrés

5 11 20

5-25oddW - Prendre les plages de pages impaires, les pivoter de 90 degrés

6-1

Dire A=in1.pdf B=in2.pdf, alors :

A1-21

Bend-1odd

A72

A1-21 Beven A72

AW - Pivoter l'intégralité d'un document de 90 degrés

B

A2-30evenL - Prendre les pages paires de la plage, retirer 90 degrés pour chaque pivotement de page

A A

AevenW AoddE

AW BW BD

Mettre des fichiers dans un PDF de manière aléatoire en utilisant les données de rattachement du fichier PDF. Plusieurs fichiers attachés peuvent être listés après attach_files. Les fichiers attachés sont ajoutés au niveau du document à moins que l'option to_page ne soit donnée, auquel cas les fichiers sont attachés à la page numérotée donnée (la première page est la 1, la dernière page est end). Par exemple :

pdftk entree.pdf attach_files table1.html table2.html to_page 6 output sortie.pdf

Copie tous les fichiers attachés depuis le PDF en entrée vers le répertoire courant ou vers un répertoire de sortie donné après l'output. Par exemple :

pdftk report.pdf unpack_files output ~/atts/

ou, de façon interactive :

pdftk report.pdf unpack_files output PROMPT

Découpe un simple document PDF d'entrée en pages individuelles. Cela crée également un rapport nommé doc_data.txt qui est le même que la sortie depuis dump_data. Si la partie output n'est pas mise, les pages du PDF sont nommées : pg_%04d.pdf, par ex : pg_OOO1.pdf, pg_0002.pdf, etc. Pour nommer ces pages vous-même, fournissez une chaîne de caractères au format "à la printf" via la partie output. Par exemple, si vous voulez nommer les pages : page_O1.pdf, page_O2.pdf, etc., passez en output page_%02.pdf à pdftk. L'encodage peut aussi être appliqué au fichier de sortie en collant à la fin des options de sortie tel que owner_pg, par ex. :

pdftk entree.pdf burst owner_pg foopass

Remplir le seul champ d'un formulaire PDF avec les données d'un fichier pdf, fichier XFDF ou l'entrée standard. Entrez le nom du fichier de données après fill_form, ou utilisez - pour passer les données via l'entrée standard, comme ceci :

pdftk formulaire.pdf fill_form donnees.fdf output formulaire.rempli.pdf

Après avoir rempli un formulaire, les champs du formulaire restent interactifs, à moins que vous utilisiez aussi l'option de sortie flatten. flatten rassemble les champs du formulaire avec les pages PDF. Vous pouvez aussi utiliser flatten seul mais seulement sur un seul PDF :

pdftk formulaire.pdf fill_form donnees.fdf output sortie.pdf flatten

ou :

pdftk formulaire.rempli.pdf output sortie.pdf flatten

Si le fichier FDF en entrée inclut des données RTF en plus de simple texte, les données RTF sont rassemblées dans les champs du formulaire aussi bien que le simple texte. Pdftk met aussi un drapeau qui signal à Acrobat/Reader de générer un nouveau champ apparance fondé sur des données RTF. De cette façon, quand les utilisateurs ouvrent le PDF, le lecteur de PDF créera les champs RTF sur place. Si le lecteur de PDF de l'utilisateur ne supporte pas le RTF, l'utilisateur verra le simple texte à la place. Si vous applatissez ce formulaire avant qu'Acrobat n'ait la chance de créer (et sauvegarder) l'apparition des nouveaux champs, vous verrez les données du champ en simple texte.

Appliquer un pdf en filigrane à l'arrière plan d'un fichier pdf d'entrée. Passez le nom du fichier PDF que vous voulez mettre en arrière plan après background comme ceci :

pdftk entree.pdf background fond.pdf output sortie.pdf

Pdftk utilise seulement la première page de l'arrière plan du PDF et l'applique à toutes les pages du PDF en entrée. Cette page est à l'échelle et orientée comme il faut pour correspondre à la page donnée. Vous pouvez utiliser - pour passer le PDF d'arrière plan à partir de pdftk via l'entrée standard.

Si le PDF d'entrée n'a pas d'arrière plan transparent (tel qu'un PDF créé à partir de pages scannées), le résultat de background ne sera pas visible -- utlisez l'option stamp à la place.

Cela se comporte tout comme l'option background à l'exception que cela chevauche la page PDF générée par stamp au-dessus du document PDF en entrée. Cela marche mieux si vous appliquez l'option stamp à une page PDF qui a un arrière-plan transparent.
Lit un fichier PDF en entrée et répertorie différentes statistiques, metadonnées, signets (alias plan), et les étiquettes des pages pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
lit un fichier PDF en entrée et répertorie le nombre de champs de formulaire pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
Lit un fichier PDF et génère un fichier FDF convenable pour fill_form pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
Change les métadonnées enregistrées dans le dictionnaire d'informations du PDF pour correspondre au fichier de donnée en entrée. Le fichier de données en entrée utilise la même syntaxe que celui de sortie pour dump_data. Cela ne change pas les métadonnées enregistrées dans le flux XMP du PDF, s'il en a un. Par exemple :

pdftk entree.pdf update_info entree.info output sortie.pdf

[output <nom du fichier de sortie | - | PROMPT>]
Le nom de fichier PDF en sortie peut ne pas être établi vers le nom du nom de fichier d'entrée. Utilisez - pour sortir à partir de la sortie standard. Quand vous utilisez l'opération dump_data, utilisez output pour établir le nom du fichier de données en sortie. Quand vous utilisez l'opération unpack_files, utilisez output pour établir le nom du répertoire de sortie. Quand vous utilisez l'opération burst, vous pouvez utiliser output pour contrôler le résultat des noms de fichiers des pages du PDF (décrit ci-dessous).
[encrypt_40bit | encrypt_128bit]
Si un mot de passe utilisateur ou propriétaire est donné au fichier de sortie PDF, le PDF résultant est encodé par défaut à  128 bits. Cela peut être empêché en spécifiant encrypt_40bit.
[allow <permissions>]
Les permissions sont appliquées au fichier PDF de sortie seulement si une longueur d'encodage est spécifiée ou si un mot de passe utilisateur ou propriétaire est donné. Si les permissions ne sont pas spécifiées, elles sont par défaut à 'none', cela veut dire que toutes les options qui vont suivre sont désactivées.

La section des permissions peut inclure une ou plusieurs des options qui suivent :

Impression de haute qualité
Impression de moyenne qualité
Autorise aussi Assembly
Autorise aussi ScreenReaders
Autorise aussi FillIn
Permet à l'utilisateur de pouvoir utiliser tout ce qui précède, et une impression de très haute qualité.
[owner_pw <mot de passe du propriétaire | PROMPT>]
[user_pw <mot de passe de l'utilisateur | PROMPT>]
Si une longueur d'encodage est donnée mais si aucun mot de passe n'est donné, le propriétaire et l'utilisateur du mot de passe restent vides, ce qui veut dire que le PDF résultant peut être ouvert et que ses paramètres de sécurité altérés par n'importe qui.
[compress | uncompress]
Ils ne sont utiles que quand vous voulez éditer un code PDF dans un éditeur de texte comme vim ou emacs. Supprimer un flux de compression d'une page PDF en appliquant le filtre uncompress. Utiliser le filtre compress pour restaurer la compression.
[flatten]
Utilisez cette option pour regrouper les champs de formulaires interactifs d'un PDF en entrée (et leurs données) avec les pages du PDF. Un seul PDF en entrée peut être donné. Parfois utilisé avec l'opération fill_form.
[keep_first_id | keep_final_id]
Quand vous combinez des pages à partir de multiple PDF, utilisez une de ces options pour copier l'ID du document depuis le premier ou le dernier document en entrée vers le nouveau PDF de sortie. Part ailleurs, pdftk crée un nouvel ID du document pour le PDF de sortie. Quand aucune opération n'est donnée, pdftk utilise toujours l'ID depuis le (seul) PDF d'entrée.
[drop_xfa]
Si votre PDF en entrée est un formulaire créé en utilisant Acrobat 7 ou Adobe Designer, il a probablement des données XFA. Remplir un tel formulaire en utilisant pdftk produit un PDF avec des données qui ne s'affichent pas dans Acrobat 7 (et 6?). La solution alternative est de supprimer les données XFA du formulaire, avant de remplir le formulaire avec pdftk ou au moment de remplir le formulaire. Utiliser cette option a pour effet que pdftk omet les données XFA du formulaire PDF de sortie.

Cette option n'est utile que quand vous utilisez pdftk sur un seul fichier PDF en entrée. Quand vous assemblez un PDF depuis de multiples fichiers en entrée en utilisant pdftk, toutes les données XFA de l'entrée seront automatiquement omises.

[verbose]
Par défaut, pdftk se lance silencieusement. Rajoutez verbose à la fin et il parlera.
[dont_ask | do_ask]
Cela dépend des préférences du temps de compilation (voir ASK_ABOUT_WARNINGS), pdftk devrait vous demander pour davantage d'entrées lorsqu'il rencontre un problème, tel qu'un mauvais mot de passe. Pour passer outre ce comportement par défaut en ajoutant dont_ask (et pdftk ne vous demandera pas quoi faire) ou do_ask (et pdftk vous demandera quoi faire).

Quand vous utilisez pdftk en mode dont_ask, cela écrasera les fichiers avec ceux de sortie sans vous le notifier.

EXEMPLES

pdftk securise.pdf input_pw foopass output nonsecurise.pdf
pdftk 1.pdf output 1.128.pdf owner_pw foopass
pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz
pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz allow printing
pdftk in1.pdf in2.pdf cat output out1.pdf
ou (utiliser des descripteurs) :
pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
ou (utilisant des jokers) :
pdftk *.pdf cat output combined.pdf

pdftk entree.pdf cat 1-12 14-end output sortie1.pdf
ou :
pdftk A=entree1.pdf cat A1-12 A14-end output sortie1.pdf
pdftk 1.pdf 2.pdf cat output 3.pdf encrypt_40bit owner_pw foopass
pdftk A=securise.pdf 2.pdf input_pw A=foopass cat output 3.pdf
pdftk doc.pdf output doc.unc.pdf uncompress
pdftk broken.pdf output fixed.pdf
pdftk entree.pdf burst
pdftk entree.pdf burst owner_pw foopass allow DegradedPrinting
Écrire un rapport sur les métadonnées et signets d'un document PDF vers report.txt
pdftk entree.pdf dump_data output report.txt
pdftk entree.pdf cat 1E 2-end output sortie.pdf
pdftk entree.pdf cat 1-endS output sortie.pdf

NOTES

pdftk utilise briévement une bibliothèque java modifiée iText (http://itextpdf.sourceforge.net/) pour lire et écrire un PDF. L'auteur a compilé cette bibliothèque java en utilisant GCJ (http://gcc.gnu.org) donc il est possible de le relier avec une interface utilisateur écrite en C++.

La page d'accueil de pdftk est http://www.accesspdf.com/pdftk/.

AUTEUR

Sid Steward (ssteward@accesspdf.com) mainteneur de pdftk.

TRADUCTION

Ce document est une traduction, réalisée par Yohav Pery le 22 mars 2008.

L'équipe de traduction a fait le maximum pour réaliser une adaptation française de qualité.

La version anglaise la plus à jour de ce document est toujours consultable via la commande : LANGUAGE=en man pdftk

N'hésitez pas à signaler à l'auteur ou au traducteur, selon le cas, toute erreur dans cette page de manuel.

18 septembre 2006