Draagbaar documentformaat

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken
Draagbaar documentformaat (PDF)
PDF-bestandspictogram
Adobe PDF-logo
Bestandsextensie : .pdf
MIME-type : aanvraag / pdf
Magisch nummer : % pdf
Ontwikkeld door: PDF-associatie
Eerste uitgave: 1993 door Adobe Inc.
Huidige versie: 2.0 (vanaf juli 2017)
Standaard(en) : ISO 32000 , Adobe: PDF-referentie (voor 1.7 en ouder)
Website : https://www.pdfa.org/


Het Portable Document Format (Engels; afgekort PDF ; Duits: (transport) portable document format ) is een platformonafhankelijk bestandsformaat dat in 1993 is ontwikkeld en gepubliceerd door Adobe Inc. en dat momenteel verder wordt ontwikkeld door de PDF Association .

Het doel was om een ​​bestandsformaat voor elektronische documenten te creëren, zodat ze getrouw aan het origineel kunnen worden gereproduceerd, ongeacht het oorspronkelijke toepassingsprogramma, besturingssysteem of hardwareplatform. Het doel is bereikt en wordt weerspiegeld in de ISO 32000-normenreeks (ISO 15930 voor PDF/X ). Voor dit doel werd in wezen de functionaliteit van het PostScript- formaat gebruikt. Een lezer van een pdf-bestand moet het document altijd kunnen bekijken en afdrukken in de door de auteur aangegeven vorm. De typische conversieproblemen (zoals gewijzigde pagina-einden of onjuiste lettertypen) bij het uitwisselen van een document tussen verschillende programma's worden zo geëlimineerd.

Naast tekst, afbeeldingen en grafieken kan een pdf-bestand ook hulpmiddelen bevatten die de navigatie binnen het document vergemakkelijken. Dit omvat bijvoorbeeld aanklikbare inhoudsopgaven en geminiaturiseerde paginavoorbeelden.

Overzicht

Basis en software

PDF-documenten en -bestanden kunnen worden gemaakt van teksten , afbeeldingen en grafische afbeeldingen - gemengd of afzonderlijk - met de juiste programma's (bijvoorbeeld met gratis programma's zoals PDFCreator en Office-pakketten LibreOffice / OpenOffice.org , betaalde programma's zoals Adobe Acrobat of gewoon via het dialoogvenster Afdrukken) en geef het weer met geschikte leesprogramma's (bijv. Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). De maker van een PDF-bestand kan het op verschillende manieren beschermen tegen ongewenst gebruik door de PDF-beveiligingsmechanismen te activeren. Versleuteling wordt gebruikt om onbevoegde toegang te voorkomen. Afhankelijk van uw behoeften kan het openen van het bestand al een wachtwoord vereisen, of het kopiëren van inhoud uit het bestand of afdrukken is mogelijk niet toegestaan. De beveiligingsmechanismen die hiervoor in PDF zijn geïmplementeerd, zijn echter niet betrouwbaar; met name eenvoudigere vormen van encryptie zijn gemakkelijk te omzeilen.

In de opstartfase was Adobe Reader betalend. Alleen de gratis verspreiding van de software maakte het mogelijk om het formaat te verspreiden zoals het nu is. PDF is lange tijd een commercieel ( eigen ) maar open bestandsformaat geweest, gedocumenteerd in Adobe's PDF Reference Manual. Adobe introduceerde het begin 2007 in het ISO-standaardisatieproces en met de publicatie op 1 juli 2008, PDF-versie 1.7 als ISO 32000-1: 2008 is een open standaard .

Bepaalde methoden voor het omgaan met PDF zijn vooraf door de ISO gestandaardiseerd om gegevensuitwisseling in prepress (als PDF / X ) en voor langdurige archivering van PDF-bestanden (als PDF / A -1 in ISO 19005-1: 2005) te vergemakkelijken.

Generatie en transformatie

PDF is een op vectoren gebaseerde paginabeschrijvingstaal waarmee de weergave vrij schaalbaar is. PDF-bestanden beschrijven de lay-out die met de aanmaaktoepassing is gemaakt in een vorm die onafhankelijk is van de printer en de standaardinstellingen, proportioneel en daarom in principe zo getrouw mogelijk aan het origineel. Dit is waar de PDF aanzienlijk verschilt van geavanceerde beschrijvings- en opmaaktalen zoals SGML of HTML als het gaat om de vereiste voor optimale lay-outgetrouwheid. Om de weergave op uitvoerapparaten met een klein weergavegebied - zoals PDA's of mobiele telefoons - te optimaliseren, kunnen markeringen (vergelijkbaar met HTML-tags) in een PDF worden opgeslagen, waardoor de pagina-inhoud kan worden opgesplitst - en dan onvermijdelijk met beperkte lay-out trouw. Dergelijke markeringen stellen een leesprogramma ook in staat om het document te lezen voor visueel gehandicapte gebruikers en maken het gemakkelijker om de inhoud naar andere formaten te converteren.

Een populaire toepassing voor het maken van PDF-bestanden is Adobe Acrobat Distiller , dat PDF's maakt van PostScript- bestanden. Acrobat Distiller is beschikbaar als desktopproduct voor Windows en macOS . Serverversies en de gratis Adobe Reader bestaan ​​ook voor andere platformen. Met behulp van de gratis software Wine draait Acrobat Distiller ook onder Linux. Verschillende office- en DTP- programma's van andere fabrikanten bieden directe PDF-export en zijn beschikbaar op een aantal platforms . Nu met tal van tools en programmeerbibliotheken, kunnen PDF-bestanden op verschillende manieren worden gemaakt met verschillende specialisaties. PDF-bestanden kunnen op bijna elk platform worden gemaakt.

Adobe geeft ontwikkelaars gedeeltelijk het recht om hun eigen applicaties te ontwikkelen voor het genereren en bewerken van PDF-documenten, maar behoudt zich het auteursrecht voor op de specificaties. [1] PDF als paginabeschrijvingstaal kan worden gezien als een verdere ontwikkeling van het grafische PostScript-model, dat ook wordt onthuld. Eind februari 2007 maakte Adobe bekend versie 1.7 van de PDF-specificatie in de ISO-standaardisatie op te nemen en werkt het samen met de Amerikaanse branchevereniging AIIM , die het secretariaat van de ISO- commissie TC 171 voert. Adobe dreigde Microsoft met antitrustrechtszaken als de open PDF-standaard zou worden geïntegreerd.

Verdere generatiemethoden worden behandeld onder Andere formaten naar PDF converteren .

Gebruik en eigenschappen

Algemene eigenschappen

Een PDF-bestand kan documenten nauwkeurig reproduceren, inclusief alle kleuren, raster- en vectorafbeeldingen en lettertypen . Een van de sterke punten van PDF is dat er weergaveprogramma's zijn voor alle gangbare platformen , zodat de inhoud ongeacht het platform getoond kan worden.

Het later bewerken van PDF-bestanden is moeilijk. Er zijn echter verschillende programma's waarmee u afzonderlijke pagina's kunt uitknippen en bepaalde inhoud kunt wijzigen. Vanaf Microsoft Word versie 2013 kunnen PDF-bestanden direct in het programma worden geconverteerd naar Word-bestanden. [2]

Omvang van documenten

Groottevergelijking: kaart van Europa en een PDF-documentpagina met de theoretisch maximaal mogelijke paginagrootte van 381 km × 381 km

PDF-documenten kunnen enkele honderdduizenden pagina's bevatten. De paginagrootte wordt niet beperkt door het formaat zelf. In Adobe Acrobat zijn er echter implementatiebeperkingen:

  • tot versie 3 tot 45 inch × 45 inch (1,143 m × 1,143 m)
  • tot versie 6 tot 200 inch × 200 inch (5,08 m × 5,08 m)
  • van versie 7 tot 15.000.000 inch × 15.000.000 inch (381 km × 381 km)

Opslag van informatie in het document

Alle informatie wordt opgeslagen als genummerde objecten in PDF-bestanden. Objecten zijn bijvoorbeeld lettertype-informatie, tekenbreedtes, gebruikte tekencoderingen (Mac / pc ...), paginabeschrijvingen, parameters voor decoders, bijsnijdvakken, individuele bladwijzers, kleurdefinities, paginavolgorde, bitmaps, formulieren, springtekens en al het andere dat is opgeslagen in PDF-bestanden kan zijn. Een PDF-bestand van honderd pagina's kan gemakkelijk 10.000 objecten bevatten.

PDF is gebaseerd op hetzelfde grafische model als de PostScript- paginabeschrijvingstaal, maar biedt enkele extra functies in vergelijking hiermee - met name interactieve elementen zoals bladwijzers, opmerkingen, formuliervelden en hun programmering met JavaScript zijn mogelijk. In vergelijking met PostScript is het grafische model voor de pagina-inhoud ook uitgebreid met functies zoals transparantie of optionele of schakelbare inhoud (aangeduid als lagen in de Acrobat-gebruikersinterface) of ondersteuning voor ICC-profielen en OpenType- lettertypen.

Lettertypen (met uitzondering van pixellettertypen) en vectorafbeeldingen kunnen naar wens worden vergroot zonder kwaliteitsverlies. Onder deze omstandigheden kunnen grote netwerkplannen en datamodellen zonder verlies op een pdf-pagina worden opgeslagen.

Tekstpassages, tabellen en grafieken (inclusief uittreksels daarvan) uit PDF-documenten kunnen eenvoudig verder worden verwerkt in andere applicatieprogramma's door de respectievelijke elementen te kopiëren en te plakken, als de maker van het document toestemming heeft gegeven. Tekst kan niet alleen worden geëxtraheerd voor verdere verwerking in andere toepassingen, maar ook om te bladeren of voor gebruik met andere uitvoermedia zoals schermlezers . Gedetailleerde inhoud kan heel gemakkelijk worden gevonden met behulp van de tekstzoekfunctie in afzonderlijke documenten of full-text onderzoek binnen een PDF-documentverzameling. Dit werkt zelfs als de tekst grafisch vervormd is, bijvoorbeeld in de vorm van een cirkel of curve.

Documentbeveiliging

Versleuteling van PDF-documenten

Een bijzonder kenmerk van PDF is de optionele documentbeveiliging met 40 of 128 bit encryptie . Door een gebruikerswachtwoord toe te kennen, is het mogelijk om het document slechts voor een beperkte groep mensen toegankelijk te maken. De auteur kan ook een apart eigenaarswachtwoord gebruiken om specifiek rechten toe te kennen aan het betreffende document. Dit voorkomt dat gebruikers delen van het document wijzigen, afdrukken of kopiëren. Maar zelfs zonder het eigenaarswachtwoord te kennen, kunnen deze rechtenbeperkingen eenvoudig worden verwijderd met behulp van verschillende tools, vooral als een eigenaarswachtwoord wordt gebruikt, maar voor het openen van het document is geen wachtwoord vereist (dit betekent dat er geen gebruikerswachtwoord is ingesteld) . De gebruiksbeperkingen die aan versleuteling zijn verbonden, kunnen eenvoudig worden omzeild door schermafbeeldingen op te slaan als bitmaps en vervolgens optische tekstherkenning te gebruiken .

Geschikte tools kunnen ook worden gebruikt om rechten toe te kennen die het mogelijk maken om notities, opmerkingen en bestandsbijlagen toe te voegen aan PDF-documenten of om formulierinvoeren op te slaan. Oorspronkelijk konden deze functies alleen met Adobe Acrobat worden gebruikt, maar vanaf versie 7 is het met de gratis Adobe Reader ook mogelijk om notities en opmerkingen toe te voegen en interactieve formuliervelden in te vullen, mits het betreffende document de benodigde autorisaties heeft gekregen van de auteur.

DRM- beveiligde PDF-bestanden bestaan ​​nu ook. Deze zijn onder andere te lezen met Adobe Digital Editions .

Kwetsbaarheden veroorzaakt door menselijke fouten

PDF-bestanden kunnen onbedoeld vertrouwelijke informatie bevatten die, hoewel niet direct zichtbaar, kan worden gevonden met behulp van tekstzoekopdrachten. Enerzijds kan informatie worden verborgen door objecten of zich buiten het paginaweergavegebied bevinden, anderzijds kan een PDF metagegevens bevatten die alleen worden weergegeven wanneer de bijbehorende dialoogvensters worden opgeroepen en soms onopgemerkt blijven. Met name bij het "verduisteren" van tekstpassages is het niet voldoende om de betreffende tekstpassage te bedekken; deze moet volledig uit de PDF worden verwijderd. Het is niet altijd eenvoudig om ongewenste informatie in een pdf te vermijden, zeker niet als je niet alleen de pdf zelf hebt gemaakt en bewerkt (en het document waaruit deze is gegenereerd). Het is belangrijk dat bij het redigeren van tekstpassages een tool wordt gebruikt die de relevante inhoud volledig verwijdert. Even belangrijk is het controleren van de metadata (te vinden in Acrobat via Bestand / Eigenschappen). Acrobat Professional 8 biedt hier uitgebreide ondersteuning, met name door een speciale functie voor het verwijderen van verborgen informatie.

Casestudy's:

  • Een dossier over de dood van de Italiaanse agent Nicola Calipari , die in maart 2005 journalist Giuliana Sgrena uit de Iraakse gijzelaar bevrijdde. Amerikaanse soldaten schoten hem kort na deze actie neer. Het gepubliceerde rapport werd gecensureerd. De redactionele revisies zijn echter gevonden in het gepubliceerde bestand door de tekst te kopiëren en op te slaan in een nieuw bestand.
  • Het Witte Huis in Washington publiceerde de toespraak "Plan for Victory in Iraq" van George W. Bush . De dossierdetails onthulden de ghostwriter , namelijk Peter Feaver , hoogleraar politieke wetenschappen aan de Duke University in North Carolina , die sinds juni 2005 de National Security Council adviseert.
  • Na de aanval op het voertuigkonvooi van de Libanese politicus Rafiq Hariri , werden de eerder verwijderde verwijzingen naar de namen van Syrische functionarissen die ervan werden verdacht verantwoordelijk te zijn voor de aanval gevonden in een openbaar gepubliceerde pdf door de VN (zie Mehlis-rapport ).
  • In 2007, als onderdeel van deFormule 1-spionageaffaire , kwamen vertrouwelijke gegevens over de Scuderia Ferrari-auto aan het publiek nadat de centrale technische waarden ervan slechts waren gemarkeerd met een zwarte balk in een pdf-document dat als bewijs diende, maar de tekst was was nog aanwezig en uittrekbaar.

Hack eenvoudig versleutelde of ondertekende PDF-documenten

In december 2019 publiceerden onderzoekers van de Ruhr Universiteit Bochum en het IT-beveiligingsbedrijf Hackmanit dat het eenvoudig mogelijk was om wijzigingen aan te brengen in ondertekende pdf-documenten zonder dat 21 van de 22 pdf-lezers het merkt. Zelfs de Adobe Acrobat Reader markeerde latere wijzigingen niet. Het bewijs werd gepresenteerd op het Chaos Communication Congress in Leipzig van 27 tot 30 december 2019. De onderzoekers toonden aan dat het mogelijk was (a) pagina's en notities toe te voegen aan ondertekende documenten zonder de handtekening ongeldig te maken, (b) oorspronkelijk ondertekende inhoud naar een andere positie in het document te verplaatsen en iets anders op de oorspronkelijke plaats te schrijven, en ( c) om de metadata van de handtekening te wijzigen (“manipuleren”). De betrokken pdf-lezers herkenden de wijziging niet en gaven toch aan dat de handtekening geldig was. De onderzoekers konden de wijzigingen aanbrengen met een eenvoudige teksteditor. [3]

De onderzoekers konden ook gemakkelijk wijzigingen aanbrengen in versleutelde pdf-documenten. Zelfs zonder het wachtwoord te kennen, kunnen ze verborgen commando's opnemen in de rol van een aanvaller. Als de aanvaller het doorstuurt naar de daadwerkelijke ontvanger en hij het wachtwoord intypt, heeft de aanvaller automatisch toegang tot de volledig gedecodeerde PDF-inhoud. Dit was mogelijk met behulp van twee methoden. De eerste methode maakt gebruik van de functie die PDF-bestanden gedeeltelijk kan versleutelen. Zo kan onder andere de structuur van de PDF worden gewijzigd en kan niet-versleutelde inhoud worden toegevoegd. Zodra het document door een geautoriseerde persoon wordt geopend, kan de aanvaller de platte tekst extraheren en zo toegang krijgen tot de inhoud. De tweede methode is gebaseerd op een kwetsbaarheid in de PDF-coderingsspecificaties. Hierdoor kan versleutelde inhoud worden gewijzigd. 27 pdf-readers zijn onderzocht op encryptie. Alle geteste PDF-readers waren gevoelig voor een van deze manipulaties. De ISO-standaard bevat geen duidelijke richtlijnen voor ontwikkelaars over hoe ze digitale handtekeningen en encryptie moeten implementeren (vanaf januari 2020). Om in de toekomst te komen tot een betrouwbare ondertekening en encryptie van PDF's met alle PDF-readers, is het noodzakelijk dat de ISO de standaard verder ontwikkelt. [3]

Bewerken van documenten

PDF is ontworpen als een uitwisselingsformaat voor voltooide documenten. Er zijn nu een aantal programma's en extensies voor Adobe Acrobat die kunnen worden gebruikt om PDF-bestanden te bewerken. Het formaat is echter niet te vergelijken met de bestandsformaten van tekstverwerkingsprogramma's of grafische programma's en is, afgezien van de notitie- en commentaarfunctie, slechts in beperkte mate geschikt voor verdere verwerking van documenten. Het is echter mogelijk, binnen bepaalde grenzen, bijvoorbeeld typefouten te verwijderen. De voordelen van desktop publishing voor grafische kunstenaars en ontwerpers zijn de integratie van alle elementen voor het printen.

Afhankelijk van het individuele geval kunnen PDF-documenten groter of kleiner zijn dan de bestanden van de oorspronkelijke aanvraag. De grootte van een document hangt af van het type gegevens dat het bevat, de efficiëntie van het aanmaakprogramma en of er lettertypen zijn ingesloten. Lettertypen kunnen ofwel volledig worden ingesloten, als een subset van de tekens die daadwerkelijk in het document worden gebruikt, of helemaal niet. Als een document betrouwbaar moet worden weergegeven, ongeacht of de gebruikte lettertypen op het doelplatform zijn geïnstalleerd, moeten ten minste de daadwerkelijk gebruikte tekens worden ingesloten.

Afdrukken in batchmodus vanaf de opdrachtregel

Afdrukken gebeurt meestal binnen de grafische gebruikersinterface van een viewer met Bestand ▸ Afdrukken… . Acrobat Reader en Foxit Reader hebben de opdrachtregeloptie / t <bestand> <printernaam> in de nieuwere versies (september 2015) gedeeltelijk verwijderd. In Acrobat kunt u alleen afdrukken op de standaardprinter, terwijl met Foxit de printer kan worden geselecteerd, maar Foxit opent het toepassingsvenster en sluit het niet na het afdrukken (de gebruiker moet het handmatig sluiten).

Linux

Over KOPJES :

 lpr -P <printernaam> "bestand.pdf"

ramen

Batch printen is mogelijk met Ghostscript . [4] Ghostscript installeert zichzelf met behulp van een installatieprogramma onder c:\Program Files\gs\gs <Versie> \ . Er zijn uitvoerbare bestanden in de submap bin \ . Voorbeeld met het DOS-venster in Windows 7:

 C: \ Program Files \ gs \ gs9.16 \ bin> gswin64c.exe \
  -dNOPAGEPROMPT \
  -dNOPROMPT \
  -dNOPAUSE \
  -dBATCH \
  [-dDEVICEWIDTHPOINTS = <Aantal Amerikaanse punten voor het papierformaat>] \
  [-dDEVICEHEIGHTPOINTS = <Aantal Amerikaanse punten voor het papierformaat>] \
  -sOutputFile = "% printer% \\ <server> \ <printernaam>" \
  -sDEVICE = mswinpr2 \
  <mijnbestand.pdf>

gswin64c.exe is de 64-bits versie zonder apart venster met interactieve modus op de opdrachtregel.

De dNO opties schakelen de interactieve modus uit. De -dDEVICE opties kunnen worden gebruikt als de printer een ongebruikelijk papierformaat gebruikt. -sOutputFile specificeert de naam van de printer. -sDEVICE verwijst naar een interne module van Ghostscript, waarbij mswinpr2 een standaardinstelling is. Aan het einde verwacht de opdrachtregel dat het bestand wordt afgedrukt (kan mislukken als de volgorde anders is). Tijdens het printen verschijnt een annuleerdialoog die zichzelf sluit (uit te -dNoCancel met -dNoCancel ).

Ghostscript voor Windows geeft het PDF-bestand ook weer in een eigen grafisch venster als er geen opdrachtregelparameters zijn. Dit display toont pixels en trapeffecten. Daarentegen is de kwaliteit van de afgedrukte documenten beduidend beter.

Serialisatie en compressie

In de loop van zijn ontwikkeling werd PDF verschillende keren aangepast aan speciale vereisten voor gebruik op internet . Oorspronkelijk moest een document volledig beschikbaar zijn om te kunnen worden weergegeven. Het is nu mogelijk om PDF-documenten te serialiseren , zodat delen ervan kunnen worden weergegeven terwijl ze worden geladen. Vanaf versie 1.5 van de PDF- specificatie kunnen meerdere objecten in een PDF worden gecombineerd en vervolgens worden gecomprimeerd, wat leidt tot een aanzienlijk betere compressie, vooral met de vele kleine objecten die nodig zijn voor de documentstructuur (beeldgegevens of de eigenlijke beschrijving van een pagina hebben altijd gecomprimeerd).

Bij het archiveren van gedrukte documenten als pdf-bestanden wordt de voorkeur gegeven aan een gemengde aanpak om zowel het originele document zoveel mogelijk te behouden als de doorzoekbaarheid te garanderen. Door de door PDF ondersteunde beeldcompressiemethoden slim te combineren, wordt een zeer sterke compressie bereikt (meestal 1: 200) door de achtergrond (meestal platte structuren en kleurovergangen) en tekst (scherpe randen, maar slechts een paar kleuren) te comprimeren met verschillende, speciaal geschikte methoden en vervolgens op elkaar geplaatst. De eigenlijke tekst wordt geëxtraheerd met behulp van het OCR- proces en onzichtbaar ingebed.

Navigatie op het scherm

In tegenstelling tot eerdere paginabeschrijvingstalen zoals PostScript, is de "preview" op het scherm niet langer alleen een hulpmiddel om testafdrukken te vermijden, maar biedt het handige functies die bij de afdruk niet mogelijk zijn: met kruisverwijzingen en literatuurverwijzingen kunt u hoeft niet naar het doel te scrollen , maar kan direct naar de doelpagina springen door op de link te klikken. Navigatie binnen het document wordt ook vergemakkelijkt door middel van paginapictogrammen of de weergave van structuurbomen (volgens de inhoudsopgave). Als u op externe links klikt, wordt het doeldocument weergegeven in de webbrowser . Deze functies moeten echter door de auteur worden "ingebouwd" (bijvoorbeeld met LaTeX en het LaTeX-uitbreidingspakket hyperref, [5] zie # TeX / DVI ) door de authoringsoftware en geïmplementeerd door de kijker .

Standaard lettertypen

14 fonts ( standaard 14 fonts ) zijn standaard beschikbaar in PDF-readers en hoeven dus niet apart in het PDF-document te worden ingesloten (behalve voor PDF/A- en PDF/X- documenten): [6]

PDF in besturingssystemen

Met het macOS- besturingssysteem van Apple werd voor het eerst PDF gebruikt als standaardformaat voor zowel scherm- als printuitvoer. De PDF-generatie kan worden gedaan vanuit elk programma dat een afdrukdialoogvenster heeft. Omdat PDF ook wordt gebruikt om de afdrukgegevens te genereren, is het mogelijk om PostScript uit te voeren op niet-Postscript-printers. Vrijwel elk type document dat kan worden afgedrukt, kan worden geconverteerd naar PDF. Deze mogelijkheid bestaat ook onder GNU / Linux. B. in het afdrukdialoogvenster van de desktopomgeving Gnome wordt de optie voor het genereren van PDF native aangeboden.

De gratis Adobe Reader / Acrobat Reader is beschikbaar als PDF- viewer onder Windows , klassiek Mac OS en macOS, GNU / Linux en de Unix-besturingssystemen Solaris , HP / UX en AIX. De geïntegreerde Lucide-viewer is beschikbaar onder eComStation . Sinds Windows 8 heeft Windows nu ook een geïntegreerde PDF-viewer. [7] Windows 10 werd door Microsoft ook uitgerust met een pdf-printer. [8e]

Voor Unix-gebaseerde systemen is er ook het Xpdf- programma, dat is teruggebracht tot de meest elementaire functies (weergave op scherm, document zoeken, afdrukken), evenals enkele andere programma's ( Okular en Evince ) die zijn aangepast aan uw desktop-omgeving. Deze open source-programma's zijn ook geschikt om de vermeende "beveiligingsfuncties" van PDF-documenten te omzeilen - het is soms mogelijk om documenten af ​​te drukken, ook al wilde de auteur de kijker van het document deze optie eigenlijk ontzeggen.

Details van de zijgeometrie

De verschillende vakken in de PDF

Informatie over de paginageometrie in een PDF-document is vooral belangrijk in de grafische industrie . Zij beschrijven welke gedeelten van een pagina van de inhoud zich bevindt die overeenkomt met de bijgesneden uiteindelijke vorm en waarbij een verdere bewerkingsprogramma (bijvoorbeeld voor oplegging , d.w.z. bevestiging pagina's op een afdrukvel) kan verwachten bekleding vergoeding. Moderne DTP-programma's slaan deze informatie op in PDF wanneer ze rechtstreeks naar PDF worden geëxporteerd. Als PDF's worden uitgevoerd via PostScript, wordt de bijbehorende informatie meestal niet opgenomen. Voor PostScript-uitvoer van bepaalde programma's kan Adobe Acrobat Distiller het netto-paginagebied afleiden uit de snijtekens, op voorwaarde dat deze ook zijn uitgevoerd.

MediaBox (mediaframe)

Het definieert de grootte van het uitvoermedium van het PDF-document. Het document is nog niet bijgesneden en bevat meestal het PostScript-paginaformaat dat in de PDF-generator is ingesteld. De MediaBox moet altijd de grootste van alle dozen zijn, aangezien deze alle andere dozen moet bevatten, en het is de enige doos die altijd in een PDF moet worden opgenomen.

CropBox (snijdoos)

De CropBox (soms het maskerframe genoemd) beschrijft het gebied van een PDF-pagina dat op het scherm of op de printer moet worden uitgevoerd. De waarden van de MediaBox zijn vooraf ingesteld.

BleedBox (afloopkader)

Een afloopvak bevat informatie over het afloopkader , dat de grootte van het uiteindelijke formaat definieert plus de beoogde bijsnijding (overvulling). In de grafische industrie is doorgaans een afloop van 3 tot 5 mm per zijde vereist. Een toepassingsvoorbeeld zijn afbeeldingen die in de afloop zijn (d.w.z. direct aan de rand van de pagina) of afbeeldingen die eraf vallen en aan de rand van de pagina worden bijgesneden. Voor een A4-pagina die op een drukker moet worden afgeleverd, resulteert een bleed-box van 3 mm in een breedte van 210 mm + 6 mm en een lengte van 297 mm + 6 mm, ofwel 216 mm × 303 mm . De waarden van de CropBox zijn vooraf ingesteld.

TrimBox (snijdoos)

De TrimBox is het uiteindelijke formaat van het document zonder enige bijsnijding.

ArtBox (objectframe)

De ArtBox (ook wel begrenzingsvak genoemd) beschrijft de paginasectie die moet worden gebruikt bij het plaatsen van de PDF-pagina in een ander programma; vergelijkbaar met de formaatspecificatie voor het importeren van een EPS- bestand.

Formulierprocessen

Naast tekst- en grafische elementen kunnen PDF-documenten interactieve formulierelementen voor formulierprocessen bevatten. Zo kunnen complete formulieren worden gebundeld in één pdf-document; De in het document vastgelegde gegevens kunnen op verschillende manieren teruggestuurd worden naar de uitgever van het formulier.

  • Printen en invullen: Het met de hand ingevulde formulier kan op conventionele manieren per post of fax worden verzonden.
  • Invullen en afdrukken: Het elektronisch ingevulde document kan op conventionele manieren worden afgedrukt en verzonden.
  • Invullen en verzenden via een HTTP-verbinding: Het elektronisch ingevulde formulier kan elektronisch worden verzonden via de webbrowser of vanuit Adobe Acrobat.
  • Vul het elektronisch ingevulde formulier in en verzend het per e-mail.

Conversie van andere formaten naar PDF

XML

PDF-documenten kunnen in twee stappen van XML- gegevens worden gemaakt:

  • Transformatie met behulp van een XSLT- stylesheet naar het XSL-FO- formaat
  • Ein PDF-Prozessor (zum Beispiel Apache FOP , Altsoft Xml2PDF ) erzeugt daraus das fertige PDF-Dokument.

Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml [9] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML ).

HTML

Aus einer HTML -Datei können PDF-Dokumente mit dem Programm HTMLDOC [10] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.

Ein Perl -Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile .

Das Programm wkhtmltopdf [11] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets [12] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt. [13] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl -Modul WKHTMLTOPDF bedient werden.

Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.

TeX/DVI

  • Aus DVI -Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (ua) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
    1. Man erzeugt aus der .dvi -Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei ( .ps ) und aus dieser mit dem Adobe Distiller oder dem Ghostscript -Teilprogramm ps2pdf [14] [15] ein .pdf – kurz dvi→ps→pdf .
    2. Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
  • pdfTeX und LuaTeX sind Weiterentwicklungen von TeX , die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.

Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf . Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf unersetzbar ist. Eine weitere Alternative bietet aber

  • XeTeX , das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF. [16] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden. [17] [18] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.

3D-Daten

Beispiel für eine 3D-PDF-Datei

3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D -Flächenmodell oder ein BREP/Flächenmodell PRC [19] enthalten. Sie dienen vorwiegend der Visualisierung von CAD -Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung. [20]

Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D [21] und die PROSTEP AG [22] übergeben. Ab Acrobat X [23] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin [24] des Unternehmens Tetra 4D verfügbar.

Einige CAD-Programme wie Allplan oder SolidWorks [25] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import. [26] Auch Werkzeuge wie Deep Exploration von SAP, [27] Pages3D von QuadriSpace [28] und 3DVIA Composer von Dassault Systèmes [29] können 3D-CAD-Modelle als 3D-PDF abspeichern.

Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils [30] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.

Videoformate

Kombination von SWF- und 3D-Daten in einer 3D-PDF

Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D-PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.

Dateien aus Büroanwendungen

Viele aktuelle Programmpakete wie Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org und Softmaker Office bieten einen PDF-Export an.

Versionen von PDF

Jahr PDF-Version Adobe-Version Charakteristika
1993 1.0/PDF 1 optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel
1994 1.1 2 externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
1996 1.2 3 Möglichkeit der Verwendung des CMYK-Farbmodells , direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. Plugins), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
1999 1.3 4 Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript -Elemente möglich
2001 1.4 5 Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4 -Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
2003 1.5 6 Einbettung von Bildern im Format JPEG 2000 , Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS#7 ; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen ( Windows 9x )
2004 1.6 7 Unterstützung für das Universal-3D -Dateiformat, Einbettung von OpenType -Fonts, Unterstützung für XFA-2.2-Rich-Text-Elemente und -Attribute, AES -Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256 , DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
2006 1.7 8 weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160 , 256-Bit AES)
2008 1.7 9 weitere Verbesserung
2010 1.7 X weitere Verbesserung
2012 1.7 XI weitere Verbesserung
2017 2.0 DC Unterstützung für das PRC -Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen [31]

Normen und Standards

In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.

Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:

ISO Jahr Typ Version Bezeichnung / Bemerkung
15930 2001 PDF/X 1.3 Format für die Übermittlung von Druckvorlagen
15930-1 2001 PDF/X-1a 1.3 siehe PDF/X
15930-5 2003 PDF/X-2 1.4 siehe PDF/X
15930-4 2003 PDF/X-1a 1.4 siehe PDF/X
15930-3 2002 PDF/X-3 1.3 siehe PDF/X
15930-6 2003 PDF/X-3 1.4 siehe PDF/X
15930-7 2008 PDF/X-4 1.6 siehe PDF/X
15930-8 2008 PDF/X-5 1.6 siehe PDF/X
19005-1 2005 PDF/A-1 1.4 Format für die elektronische Archivierung
19005-1 2007 PDF/A-1 1.4 Korrektur PDF/A-1
19005-2 2011 PDF/A-2 1.7 siehe PDF/A-1
19005-3 2012 PDF/A-3 1.7 siehe PDF/A-1
24517 2008 PDF/E 1.6 Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
2008 PDF/H Format für Dokumente im Gesundheitswesen (PDF Healthcare)
14289 2008 PDF/UA 1.7 Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
16612-2 2010 PDF/VT 1.6 Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
32000-1 2008 PDF 1.7 1.7
32000-2 2017 PDF 2.0 2.0[32]

Literatur

Weblinks

Commons : Portable Document Format – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: PDF – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF; 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems, November 2004, S. 7 , archiviert vom Original am 16. Juni 2015 ; abgerufen am 3. November 2010 (englisch).
  2. PDF . Wiki von Ubuntuusers.de
  3. a b Chaos Communication Congress: Glauben Sie nicht alles, was in einem PDF-Dokument steht . Zeit Online , Dezember 2019; abgerufen am 4. Januar 2020.
  4. ghostscript.com ( Memento vom 13. September 2015 im Internet Archive )
  5. Paket hyperref. Comprehensive TeX Archive Network ; abgerufen am 2. Januar 2018.
  6. PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts ( Memento vom 6. Juli 2015 im Internet Archive ) (PDF, 31 MB, 1.310 S.)
  7. netzwelt.de
  8. giga.de
  9. Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (englisch).
  10. HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016 ; abgerufen am 16. Januar 2017 (englisch).
  11. wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  12. Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  13. Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011 .
  14. ps2pdf: PostScript-to-PDF converter auf ghostscript .com
  15. PStricks-Seite über PDF-Export. tug.org.
  16. xetex auf CTAN.
  17. Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
  18. Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
  19. PRC Format Specification ( Memento vom 2. Dezember 2008 im Internet Archive ) bei Adobe
  20. Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures . In: PeerJ Computer Science . Band   2 , 20. Juni 2016, ISSN 2376-5992 , doi : 10.7717/peerj-cs.64 ( peerj.com [abgerufen am 28. Juni 2016]).
  21. Acrobat Pro Bundle ( Memento vom 11. Mai 2012 im Internet Archive ) bei Tech Soft 3D
  22. PDF Generator 3D der PROSTEP AG
  23. Acrobat X Pro bei Adobe
  24. 3D PDF Converter-Plug-in bei Tetra 4D
  25. official help-documentation. DassaultSystemes Solidworks, abgerufen am 27. Juni 2019 (englisch).
  26. Datenaustauschformate . allplan.com
  27. Deep Exploration ( Memento vom 7. September 2012 im Webarchiv archive.today ) von Right Hemisphere, seit 2012 SAP
  28. Pages3D, QuadriSpace
  29. 3DVIA Composer ( Memento vom 25. Mai 2013 im Webarchiv archive.today ) bei Dassault Systèmes
  30. 3D-PDF Beispiel bei UNITEC Informationssysteme
  31. Taking Documents to the Next Level with PDF 2.0. (PDF) Adobe, abgerufen am 11. September 2017 (englisch).
  32. ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (englisch).