Raster, Vector en Tekst: wat staat er nu echt in mijn PDF?

Samenvatting

Hoe u kunt bepalen of uw PDF is gebaseerd op een raster of vector en hoe dit de mogelijkheid beïnvloedt om vast te maken aan een object of tekst te selecteren.

Relevante producten

Revu® voor Windows® en Revu voor Mac®


Probleem

  • U kunt niet vastmaken aan een object als u metingen aan het doen bent.
  • U kunt geen tekst bewerken via Bewerken > PDF-inhoud > Tekst bewerken.
  • U kunt geen tekst selecteren of zoeken.

Waarom gebeurt dit?

De reden dat dit gebeurt is dat PDF-bestanden niet allemaal op dezelfde manier worden gemaakt. Het ene PDF-bestand bevat meer informatie dan het ander, ondanks dat dit in eerste instantie niet te zien is.

De pagina kan lijnen en tekens lijken te bevatten, maar de onderliggende elementen die ze in de PDF vertegenwoordigen zijn mogelijk geen vectorlijnen en tekstelementen, welke nodig zijn om content aan vast te maken en om tekst te zoeken en te selecteren.

Raster vs. vector

Laten we de verschillen eens bekijken tussen raster- en vectorinhoud in een PDF.

Raster PDF Vector PDF

Raster

Een rasterafbeelding wordt gemaakt van een serie vierkante stippen, die ook wel pixels genoemd worden. Een voorbeeld van een raster-PDF is een bestand dat wordt aangemaakt door een pagina te scannen. Een gescande PDF wordt gemaakt door een bitmap-afbeelding te maken (zoals een JPEG of TIFF) van de pagina en deze afbeelding op de PDF-pagina te plaatsen. Dit betekent dat een gescande of raster-PDF slechts een raster met stippen bevat die lijnen en tekst vertegenwoordigen. Het bevat geen daadwerkelijke lijnen of tekst die een computer kan herkennen. Daarom zijn er geen lijnen voor de functie Vastmaken aan content waaraan vastgemaakt kan worden en is er geen tekst om te selecteren of zoeken.

Zoom heel ver in om te bepalen of een PDF een raster afbeelding of scan is. De lijnen en tekens op de pagina veranderen in een raster van vierkante stippen of worden wazig.

Vector

Een PDF-bestand dat op vectoren is gebaseerd, gebruikt lijnsegmenten om alle geometrie op de pagina te definiëren. De meeste PDF-bestanden die vanuit CAD-programma’s (Computer-Aided Design) worden gemaakt, zijn gebaseerd op vectoren. Vector PDF-bestanden rasteren vaak PDF-bestanden omdat ze meer gegevens bevatten zodat er makkelijker mee gewerkt kan worden. Probeer altijd te werken met vector PDF-bestanden die zijn gemaakt vanuit de bron in plaats van PDF-bestanden te maken van scans.

Het voordeel van werken met een vector PDF is dat de weergave van de geometrie scherp blijft als u erop inzoomt om details van de tekening te bekijken. Daardoor zijn metingen en take-offs (evenals de kalibratie daarvan) nauwkeurig in een vector PDF omdat u de functie Vastmaken aan content kunt gebruiken om vast te maken aan de vectorlijnen in de PDF.

Tekst

Tekst is een onafhankelijk soort content in PDF-bestanden. U ziet de teksttekens wel in de PDF, maar die tekens zijn niet altijd tekstelementen van de PDF. De tekst kan ook worden gedefinieerd door rasterstippen of segmenten van vectorlijnen. Hoewel deze elementen tekst lijken te zijn, bevatten ze niet de gegevens waardoor een computer ze als tekst kan herkennen. Hierdoor is dit soort ‘tekst’ vaak een afbeelding die niet kan worden geselecteerd, doorzocht of bewerkt.

Om verwarring te voorkomen, verwijzen "tekens" naar tekst in het algemeen, terwijl "tekst" verwijst naar tekstelementen van een PDF, ofwel "echte tekst".

Voordat we hier verder op in gaan, volgt hier een snelle test om te bepalen of uw PDF tekst bevat. Ga vanuit de menubalk naar Bewerken > PDF-inhoud > Alle tekst selecteren. (Ga in Revu 2017 en lager naar Bewerken > Selecteren > Alle tekst selecteren). Alle tekst in de PDF wordt dan blauw gemarkeerd. Als de tekens niet worden gemarkeerd, zijn ze een raster- of vectorafbeelding.

  1. PDF Tekstelementen(of echte tekst) – Heeft altijd de voorkeur voor PDF-bestanden omdat het tot responsievere content leidt. PDF-bestanden die worden aangemaakt vanuit programma’s gebaseerd op tekens (bijv. Word® en Excel®) maken bijna altijd PDF-bestanden die echte tekst bevatten. Als u inzoomt op de tekst, blijven de randen van de tekens altijd scherp en duidelijk – ongeacht hoe ver u inzoomt. De tekst kan worden doorzocht en kan altijd worden geselecteerd.
  2. Optical Character Recognition (OCR) tekst – Als u OCR uitvoert (alleen voor Revu eXtreme) kunnen raster- en vectorafbeeldingen worden vertaald naar doorzoekbare gegevens. Met andere woorden: OCR interpreteert de afbeeldingen op een gescande PDF en maakt daar bovenop een onzichtbare tekstlaag aan. In deze laag kunt u afbeeldingen doorzoeken, selecteren en markeren die geen echte tekst bevatten.
  3. Vectortekens – Gemaakt door lijnsegmenten die worden gebruikt om de vorm van elk teken te tekenen. Dit gebeurt vaak als de PDF is gemaakt vanuit CAD (vaak AutoCAD®) of als er een ander lettertype dan TrueType wordt gebruikt.
    • Waarom gebruikt CAD geen TrueType lettertypen om echte tekst te maken? Dat is omdat AutoCAD al ouder is dan Macintosh®, Windows® en TrueType-lettertypen. Ze moesten hun eigen lettertypesysteem maken, ook wel SHX-lettertypen genaamd. SHX-lettertypen worden gedefinieerd door lijnsegmenten te gebruiken. Deze lijnsegmenten worden in de PDF omgezet in plaats van tekstgegevens.
    • Het gebruik van TrueType lettertypen in CAD heeft de voorkeur als PDF-bestanden worden aangemaakt. De Bluebeam plug-in voor AutoCAD zet TrueType lettertypen automatisch om in doorzoekbare tekst.
    • Vector tekens zijn te herkennen aan hun grove omtrek als erop ingezoomd wordt. Deze grove omtrek wordt gemaakt door de lijnsegmenten waar elk teken uit bestaat.
    • Grafische ontwerpprogramma’s (bijv. Adobe Illustrator®) maken ook vectortekens. Deze vectortekens hebben scherpe randen als u erop inzoomt.
  4. Rastertekens – Zoals eerder gezegd worden individuele pixels gebruikt om elk teken te definiëren.

Meer informatie

AutoCAD: PDF’s maken met doorzoekbare tekst – Ontdek hoe u doorzoekbare PDF’s maakt met AutoCAD.

 

How-to

Revu 2017 & ouder

Revu 2018

Revu 2019

Revu voor Mac 2

Revu voor Mac 1

Documentverwerking

Related Articles