table of contents
PDFTK(1) | Manuel de l'utilisateur Linux | PDFTK(1) |
NOM¶
pdftk - Un outil pratique de manipulation de fichiers PDF
SYNOPSIS¶
pdftk <fichiers PDF d'entrée | - |
PROMPT>
[input_pw <mots de passe du PDF d'entrée |
PROMPT>]
[<opération> <arguments d'opération>]
[output <nom du fichier de sortie | - | PROMPT>]
[encrypt_40bit | encrypt_128bit]
[allow <permissions>]
[owner_pw <mot de passe du propriétaire | PROMPT>]
[user_pw <mot de passe de l'utilisateur | PROMPT>]
[flatten] [compress | uncompress]
[keep_first_id | keep_final_id] [drop_xfa]
[verbose] [dont_ask | do_ask]
Où:
<opération> peut être vide, ou :
[cat | attach_files | unpack_files | burst |
fill_form | background | stamp | generate_fdf
dump_data | dump_data_fields | update_info]
Pour une aide complète : pdftk --help
DESCRIPTION¶
Si le format PDF était un papier électronique, pdftk serait un "retire-agrafe", troueur, classeur, un anneau de décodage secret et des lunettes à rayons X. Pdftk est un outil simple pour manipuler tous les jours des documents PDF. Utilisez-le pour :
* Fusionner des documents PDF
* Diviser des pages PDF dans un nouveau document
* Faire pivoter des documents/pages PDF
* Décrypter des entrées comme bon vous semble (mot de passe
requis)
* Chiffrer les sorties comme vous le voulez
* Remplir des formulaires PDF avec X/PDF ou des formulaires bidimensionnels
* Générer FDF Data Stencil depuis un formulaire PDF
* Appliquer un fond d'écran Watermark ou un traitement tampon
* Signaler les conversions PDF comme les métadonnées et les
signets
* Mettre à jour des metadonnées PDF
* Ajouter des fichiers aux pages PDF ou au document PDF
* Extraire les fichiers joints PDF
* Diviser un document PDF en plusieurs pages
* Décompresser et recompresser des flots de pages
* Réparer les PDF corrompus (quand c'est possible)
OPTIONS¶
Une sélection d'options est incluse ci-dessous.
- --help, -h
- Montre un résumé des options.
- <fichiers PDF d'entrée | - | PROMPT>
- Une liste de fichiers PDF en entrée. Si vous voulez combiner les
PDF (sans utiliser de queues), listez les fichiers dans l'ordre où
vous voulez qu'ils soient combinés. Utilisez - pour passer
un seul PDF avec pdftk via l'entrée standard. Les fichiers en
entrée peuvent être associés à un descripteur,
où le descripteur est une simple lettre majuscule :
<descripteur du PDF d'entrée>=<nom du fichier PDF d'entrée>
Les descripteurs sont souvent omis. Ils sont utiles quand on spécifie un mot de passe ou des séries de pages, plus tard.
Par exemple: A=input1.pdf B=input2.pdf
- [input_pw <propre mot de passe du PDF d'entrée| PROMPT>]
- Les mot de passe propriétaires d'entrée, si
nécessaire, sont associés avec les fichiers en utilisant
leurs descripteurs.
<descripteur du PDF d'entrée>=<code personnel d'accès au ficher PDF d'entrée>
Si les descripteurs ne sont pas donnés, les mots de passe sont associés avec les fichiers d'entrée en ordre.
La plupart des options de pdftk nécessitent que les entrées PDF soient accompagnées du mot de passe "propriétaire". Si ce PDF n'a pas de mot de passe propriétaire, il faudra donner le mot de passe "utilisateur". Si le PDF d'entrée n'a pas de mot de passe, aucun mot de passe ne devra être donné.
Quand le mode do_ask est activé, pdftk vous demandera un mot de passe si le mot de passe donné est incorrect ou qu'aucun mot de passe n'a été donné.
- [<opération> <arguments d'opération>]
- Si cet argument optionnel est oublié, pdftk se lance en mode
'filter'. Ce mode ne prend qu'un PDF en entrée et crée un
autre fichier PDF après avoir effectué toutes les options de
sortie, comme l'encodage et la compression.
Les commandes disponibles sont : cat, attach_files, unpack_files, burst, fill_form, background, stamp, dump_data, dump_data_fields, generate_fdf, update_info. Quelques commandes prennent un argument supplémentaire, comme décrit ci-dessous.
- cat [<plage de pages>]
- Concatène des pages depuis des pdf en entrée afin de
créer un nouveau PDF. L'ordre d'affichage de la page dans le
nouveau PDF est specifié par l'ordre donné
précedemment. L'ordonnement des pages est décrit comme
ceci :
<descripteur du PDF d'entrée>[<numéro de page de début>[-<numéro de page de fin>[<qualificatif>]]][<sens de la page>]
Les endroits où le descripteur identifie l'un des PDF d'entrée, ainsi que le numéro de page sont référencés à partir de 1 dans les pages du fichier PDF, et le qualificateur peut être pair ou impair, et la rotation peut être N, S, E, W, L, R, ou D.
Si le descripteur n'est pas mis pour la série de pages, les pages sont prises depuis le premier PDF en entrée.
Le qualificateur pair a pour effet que pdftk n'utilise que les pages du PDF numérotées paires, 1-6even produira les pages 2, 4 et 6 dans cet ordre. 6-1even produira les pages 6, 4 et 2 dans cet ordre.
Les qualificateurs pair et impairXS agissent de la même façon.
Les réglages de rotation peuvent provoquer la rotation des pages et des documents. Chaque option définit la rotation de la page comme suit N: 0, E: 90, S: 180, W: 270, L: -90, R: +90, D: +180. L, R, et D effectue les ajustements relatifs à la rotation de la page.
Si aucun argument n'est donné à cat, le pdftk va combiner tous les fichiers PDF en entrée dans l'ordre où ils ont été donnés pour créer le fichier de sortie.
* <Le nombre de pages final> peut être moindre que <le nombre de pages du début>. * Le mot clé end peut être utilisé pour référencer la dernière page du document à la place d'un numéro de page
* Référencer une seule page en omettant le numéro de la page de fin.
* Le descripteur peut être utilisé seul pour représenter le document PDF en entier par exemple Bl-end est le même que B.
1-endE - Pivoter l'intégralité d'un document de 90 degrés
5 11 20
5-25oddW - Prendre les plages de pages impaires, les pivoter de 90 degrés
6-1
Dire A=in1.pdf B=in2.pdf, alors :
A1-21
Bend-1odd
A72
A1-21 Beven A72
AW - Pivoter l'intégralité d'un document de 90 degrés
B
A2-30evenL - Prendre les pages paires de la plage, retirer 90 degrés pour chaque pivotement de page
A A
AevenW AoddE
AW BW BD
- attach_files <nom des fichiers joints | PROMPT> [to_page <nombre de page | PROMPT>]
- Mettre des fichiers dans un PDF de manière aléatoire en
utilisant les données de rattachement du fichier PDF. Plusieurs
fichiers attachés peuvent être listés après
attach_files. Les fichiers attachés sont ajoutés au
niveau du document à moins que l'option to_page ne
soit donnée, auquel cas les fichiers sont attachés à
la page numérotée donnée (la première page est
la 1, la dernière page est end). Par exemple :
pdftk entree.pdf attach_files table1.html table2.html to_page 6 output sortie.pdf
- unpack_files
- Copie tous les fichiers attachés depuis le PDF en entrée
vers le répertoire courant ou vers un répertoire de sortie
donné après l'output. Par exemple :
pdftk report.pdf unpack_files output ~/atts/
ou, de façon interactive :
pdftk report.pdf unpack_files output PROMPT
- burst
- Découpe un simple document PDF d'entrée en pages
individuelles. Cela crée également un rapport nommé
doc_data.txt qui est le même que la sortie depuis
dump_data. Si la partie output n'est pas mise, les pages du
PDF sont nommées : pg_%04d.pdf, par ex : pg_OOO1.pdf,
pg_0002.pdf, etc. Pour nommer ces pages vous-même, fournissez une
chaîne de caractères au format "à la
printf" via la partie output. Par exemple, si vous voulez nommer les
pages : page_O1.pdf, page_O2.pdf, etc., passez en output
page_%02.pdf à pdftk. L'encodage peut aussi être
appliqué au fichier de sortie en collant à la fin des
options de sortie tel que owner_pg, par ex. :
pdftk entree.pdf burst owner_pg foopass
- fill_form <nom du fichier FDF | nom du fichier XFDF | - | PROMPT>
- Remplir le seul champ d'un formulaire PDF avec les données d'un
fichier pdf, fichier XFDF ou l'entrée standard. Entrez le nom du
fichier de données après fill_form, ou utilisez
- pour passer les données via l'entrée standard,
comme ceci :
pdftk formulaire.pdf fill_form donnees.fdf output formulaire.rempli.pdf
Après avoir rempli un formulaire, les champs du formulaire restent interactifs, à moins que vous utilisiez aussi l'option de sortie flatten. flatten rassemble les champs du formulaire avec les pages PDF. Vous pouvez aussi utiliser flatten seul mais seulement sur un seul PDF :
pdftk formulaire.pdf fill_form donnees.fdf output sortie.pdf flatten
ou :
pdftk formulaire.rempli.pdf output sortie.pdf flatten
Si le fichier FDF en entrée inclut des données RTF en plus de simple texte, les données RTF sont rassemblées dans les champs du formulaire aussi bien que le simple texte. Pdftk met aussi un drapeau qui signal à Acrobat/Reader de générer un nouveau champ apparance fondé sur des données RTF. De cette façon, quand les utilisateurs ouvrent le PDF, le lecteur de PDF créera les champs RTF sur place. Si le lecteur de PDF de l'utilisateur ne supporte pas le RTF, l'utilisateur verra le simple texte à la place. Si vous applatissez ce formulaire avant qu'Acrobat n'ait la chance de créer (et sauvegarder) l'apparition des nouveaux champs, vous verrez les données du champ en simple texte.
- background <nom du fichier PDF d'arrière plan | - | PROMPT>
- Appliquer un pdf en filigrane à l'arrière plan d'un
fichier pdf d'entrée. Passez le nom du fichier PDF que vous voulez
mettre en arrière plan après background comme ceci :
pdftk entree.pdf background fond.pdf output sortie.pdf
Pdftk utilise seulement la première page de l'arrière plan du PDF et l'applique à toutes les pages du PDF en entrée. Cette page est à l'échelle et orientée comme il faut pour correspondre à la page donnée. Vous pouvez utiliser - pour passer le PDF d'arrière plan à partir de pdftk via l'entrée standard.
Si le PDF d'entrée n'a pas d'arrière plan transparent (tel qu'un PDF créé à partir de pages scannées), le résultat de background ne sera pas visible -- utlisez l'option stamp à la place.
- stamp <nom du fichier PDF à timbrer | - | PROMPT>
- Cela se comporte tout comme l'option background à l'exception que cela chevauche la page PDF générée par stamp au-dessus du document PDF en entrée. Cela marche mieux si vous appliquez l'option stamp à une page PDF qui a un arrière-plan transparent.
- dump_data
- Lit un fichier PDF en entrée et répertorie différentes statistiques, metadonnées, signets (alias plan), et les étiquettes des pages pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
- dump_data_fields
- lit un fichier PDF en entrée et répertorie le nombre de champs de formulaire pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
- generate_fdf
- Lit un fichier PDF et génère un fichier FDF convenable pour fill_form pour le nom de fichier de sortie donné ou (si aucun nom n'est donné) pour la sortie standard. Cela ne crée pas un nouveau PDF.
- update_info <nom du fichier d'informations | - | PROMPT>
- Change les métadonnées enregistrées dans le
dictionnaire d'informations du PDF pour correspondre au fichier de
donnée en entrée. Le fichier de données en
entrée utilise la même syntaxe que celui de sortie pour
dump_data. Cela ne change pas les métadonnées
enregistrées dans le flux XMP du PDF, s'il en a un. Par
exemple :
pdftk entree.pdf update_info entree.info output sortie.pdf
- [output <nom du fichier de sortie | - | PROMPT>]
- Le nom de fichier PDF en sortie peut ne pas être établi vers le nom du nom de fichier d'entrée. Utilisez - pour sortir à partir de la sortie standard. Quand vous utilisez l'opération dump_data, utilisez output pour établir le nom du fichier de données en sortie. Quand vous utilisez l'opération unpack_files, utilisez output pour établir le nom du répertoire de sortie. Quand vous utilisez l'opération burst, vous pouvez utiliser output pour contrôler le résultat des noms de fichiers des pages du PDF (décrit ci-dessous).
- [encrypt_40bit | encrypt_128bit]
- Si un mot de passe utilisateur ou propriétaire est donné au fichier de sortie PDF, le PDF résultant est encodé par défaut à 128 bits. Cela peut être empêché en spécifiant encrypt_40bit.
- [allow <permissions>]
- Les permissions sont appliquées au fichier PDF de sortie seulement
si une longueur d'encodage est spécifiée ou si un mot de
passe utilisateur ou propriétaire est donné. Si les
permissions ne sont pas spécifiées, elles sont par
défaut à 'none', cela veut dire que toutes les
options qui vont suivre sont désactivées.
La section des permissions peut inclure une ou plusieurs des options qui suivent :
- Printing
- Impression de haute qualité
- DegradePrinting
- Impression de moyenne qualité
- ModifyContents
- Autorise aussi Assembly
- Assembly
- CopyContents
- Autorise aussi ScreenReaders
- ScreeReaders
- ModifyAnnotations
- Autorise aussi FillIn
- FillIn
- AllFeatures
- Permet à l'utilisateur de pouvoir utiliser tout ce qui précède, et une impression de très haute qualité.
- [owner_pw <mot de passe du propriétaire | PROMPT>]
- [user_pw <mot de passe de l'utilisateur | PROMPT>]
- Si une longueur d'encodage est donnée mais si aucun mot de passe n'est donné, le propriétaire et l'utilisateur du mot de passe restent vides, ce qui veut dire que le PDF résultant peut être ouvert et que ses paramètres de sécurité altérés par n'importe qui.
- [compress | uncompress]
- Ils ne sont utiles que quand vous voulez éditer un code PDF dans un éditeur de texte comme vim ou emacs. Supprimer un flux de compression d'une page PDF en appliquant le filtre uncompress. Utiliser le filtre compress pour restaurer la compression.
- [flatten]
- Utilisez cette option pour regrouper les champs de formulaires interactifs d'un PDF en entrée (et leurs données) avec les pages du PDF. Un seul PDF en entrée peut être donné. Parfois utilisé avec l'opération fill_form.
- [keep_first_id | keep_final_id]
- Quand vous combinez des pages à partir de multiple PDF, utilisez une de ces options pour copier l'ID du document depuis le premier ou le dernier document en entrée vers le nouveau PDF de sortie. Part ailleurs, pdftk crée un nouvel ID du document pour le PDF de sortie. Quand aucune opération n'est donnée, pdftk utilise toujours l'ID depuis le (seul) PDF d'entrée.
- [drop_xfa]
- Si votre PDF en entrée est un formulaire créé en
utilisant Acrobat 7 ou Adobe Designer, il a probablement des
données XFA. Remplir un tel formulaire en utilisant pdftk produit
un PDF avec des données qui ne s'affichent pas dans Acrobat 7 (et
6?). La solution alternative est de supprimer les données XFA du
formulaire, avant de remplir le formulaire avec pdftk ou au moment de
remplir le formulaire. Utiliser cette option a pour effet que pdftk omet
les données XFA du formulaire PDF de sortie.
Cette option n'est utile que quand vous utilisez pdftk sur un seul fichier PDF en entrée. Quand vous assemblez un PDF depuis de multiples fichiers en entrée en utilisant pdftk, toutes les données XFA de l'entrée seront automatiquement omises.
- [verbose]
- Par défaut, pdftk se lance silencieusement. Rajoutez verbose à la fin et il parlera.
- [dont_ask | do_ask]
- Cela dépend des préférences du temps de compilation
(voir ASK_ABOUT_WARNINGS), pdftk devrait vous demander pour davantage
d'entrées lorsqu'il rencontre un problème, tel qu'un mauvais
mot de passe. Pour passer outre ce comportement par défaut en
ajoutant dont_ask (et pdftk ne vous demandera pas quoi faire) ou
do_ask (et pdftk vous demandera quoi faire).
Quand vous utilisez pdftk en mode dont_ask, cela écrasera les fichiers avec ceux de sortie sans vous le notifier.
EXEMPLES¶
- Décoder un PDF
- pdftk securise.pdf input_pw foopass output nonsecurise.pdf
- Encoder un PDF utilisant un codage 128-bit (par défaut), conservant toutes les permissions(par défaut)
- pdftk 1.pdf output 1.128.pdf owner_pw foopass
- Comme ci-dessus, à part que le mot de passe 'baz' doit aussi être utilisé pour ouvrir le PDF de sortie
- pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz
- Comme ci-dessus, à part que l'impression est autorisée (une fois que le PDF est ouvert)
- pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz allow printing
- Joindre in1.pdf et in2.pdf vers un nouveau PDF, out1.pdf
- pdftk in1.pdf in2.pdf cat output out1.pdf
ou (utiliser des descripteurs) :
pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
ou (utilisant des jokers) :
pdftk *.pdf cat output combined.pdf - Supprimer 'page 13' depuis in1.pdf pour créer out1.pdf
-
pdftk entree.pdf cat 1-12 14-end output sortie1.pdf
ou :
pdftk A=entree1.pdf cat A1-12 A14-end output sortie1.pdf - Appliquer un encodage de 40-bit pour un fichier de sortie, retirant toutes les permissions (par défaut). Définir 'foopass' comme mot de passe propriétaire.
- pdftk 1.pdf 2.pdf cat output 3.pdf encrypt_40bit owner_pw foopass
- Joindre deux fichiers, un qui requiert le mot de passe 'foopass'. Le fichier de sortie n'est pas encodé.
- pdftk A=securise.pdf 2.pdf input_pw A=foopass cat output 3.pdf
- Décompresser une flux de page PDF pour éditer le PDF dans un éditeur de texte (par ex, vim, emacs)
- pdftk doc.pdf output doc.unc.pdf uncompress
- Réparer une table XREF d'un PDF corrompu et la taille du flux, si possible
- pdftk broken.pdf output fixed.pdf
- Séparer un simple document PDF en pages et mettre ses données vers doc_data.txt
- pdftk entree.pdf burst
- Séparer un simple document PDF en pages encodées. Autorise l'impression basse qualité
- pdftk entree.pdf burst owner_pw foopass allow DegradedPrinting
- Écrire un rapport sur les métadonnées et signets d'un document PDF vers report.txt
- pdftk entree.pdf dump_data output report.txt
- Faire pivoter la première page d'un PDF de 90 degrés dans le sens des aiguilles d'une montre
- pdftk entree.pdf cat 1E 2-end output sortie.pdf
- Faire pivoter un document PDF entier de 180 degrés
- pdftk entree.pdf cat 1-endS output sortie.pdf
NOTES¶
pdftk utilise briévement une bibliothèque java modifiée iText (http://itextpdf.sourceforge.net/) pour lire et écrire un PDF. L'auteur a compilé cette bibliothèque java en utilisant GCJ (http://gcc.gnu.org) donc il est possible de le relier avec une interface utilisateur écrite en C++.
La page d'accueil de pdftk est http://www.accesspdf.com/pdftk/.
AUTEUR¶
Sid Steward (ssteward@accesspdf.com) mainteneur de pdftk.
TRADUCTION¶
Ce document est une traduction, réalisée par Yohav Pery le 22 mars 2008.
L'équipe de traduction a fait le maximum pour réaliser une adaptation française de qualité.
La version anglaise la plus à jour de ce document est toujours consultable via la commande : LANGUAGE=en man pdftk
N'hésitez pas à signaler à l'auteur ou au traducteur, selon le cas, toute erreur dans cette page de manuel.
18 septembre 2006 |