Problemen met rastergebaseerde pdf's
Samenvatting
Hoe u kunt bepalen of uw PDF is gebaseerd op een raster of vector en hoe dit de mogelijkheid beïnvloedt om vast te maken aan een object of tekst te selecteren.
Probleem
- U kunt niet vastmaken aan een object als u metingen aan het doen bent.
- U kunt geen tekst bewerken met Bewerken > PDF-inhoud > Tekst bewerken.
- U kunt geen tekst selecteren of zoeken.
Waarom gebeurt dit?
De reden dat dit gebeurt is dat PDF-bestanden niet allemaal op dezelfde manier worden gemaakt. Het ene PDF-bestand bevat meer informatie dan het ander, ondanks dat dit in eerste instantie niet te zien is.
De pagina kan lijnen en tekens lijken te bevatten, maar de onderliggende elementen die ze in de PDF vertegenwoordigen zijn mogelijk geen vectorlijnen en tekstelementen, welke nodig zijn om content aan vast te maken en om tekst te zoeken en te selecteren.
Raster vs. vector
Laten we de verschillen eens bekijken tussen raster- en vectorinhoud in een PDF.
| Raster PDF | Vector PDF |
|
|
Raster
Een rasterafbeelding wordt gemaakt van een serie vierkante stippen, die ook wel pixels genoemd worden. Een voorbeeld van een raster-PDF is een bestand dat wordt aangemaakt door een pagina te scannen. Een gescande PDF wordt gemaakt door een bitmap-afbeelding te maken (zoals een JPEG of TIFF) van de pagina en deze afbeelding op de PDF-pagina te plaatsen. Dit betekent dat een gescande of raster-PDF slechts een raster met stippen bevat die lijnen en tekst vertegenwoordigen. Het bevat geen daadwerkelijke lijnen of tekst die een computer kan herkennen. Daarom zijn er geen lijnen voor de functie Vastmaken aan content waaraan vastgemaakt kan worden en is er geen tekst om te selecteren of zoeken.
Zoom heel ver in om te bepalen of een PDF een raster afbeelding of scan is. De lijnen en tekens op de pagina veranderen in een raster van vierkante stippen of worden wazig.
Vector
Een PDF-bestand dat op vectoren is gebaseerd, gebruikt lijnsegmenten om alle geometrie op de pagina te definiëren. De meeste PDF-bestanden die vanuit CAD-programma's (Computer-Aided Design) worden gemaakt, zijn gebaseerd op vectoren. Vector PDF-bestanden rasteren vaak PDF-bestanden omdat ze meer gegevens bevatten zodat er makkelijker mee gewerkt kan worden. Probeer altijd te werken met vector PDF-bestanden die zijn gemaakt vanuit de bron in plaats van PDF-bestanden te maken van scans.
Het voordeel van werken met een vector PDF is dat de weergave van de geometrie scherp blijft als u erop inzoomt om details van de tekening te bekijken. Daardoor zijn metingen en take-offs (evenals de kalibratie daarvan) nauwkeurig in een vector PDF omdat u de functie Vastmaken aan content kunt gebruiken om vast te maken aan de vectorlijnen in de PDF.
Tekst
Tekst is een onafhankelijk soort content in PDF-bestanden. U ziet de teksttekens wel in de PDF, maar die tekens zijn niet altijd tekstelementen van de PDF. De tekst kan ook worden gedefinieerd door rasterstippen of segmenten van vectorlijnen. Hoewel deze elementen tekst lijken te zijn, bevatten ze niet de gegevens waardoor een computer ze als tekst kan herkennen. Hierdoor is dit soort 'tekst' vaak een afbeelding die niet kan worden geselecteerd, doorzocht of bewerkt.
Voordat we in detail treden, volgt hier een snelle test waarmee u kunt bepalen of uw PDF tekst bevat. Ga in de menubalk naar Bewerken > PDF-inhoud > Alle tekst selecteren (in Revu 2017 en lager, ga naar Bewerken > Selecteren > Alle tekst selecteren). Alle tekst in het PDF-bestand moet blauw worden gemarkeerd. Als de tekens niet worden gemarkeerd, betreft het een raster- of vectorbeeld.
- PDF-tekstelementen (of echte tekst) – Altijd de voorkeur voor PDF's omdat dit resulteert in meer responsieve inhoud. PDF's die zijn gemaakt met programma's die gebruikmaken van tekens (bijvoorbeeld Word en Excel) bevatten vrijwel altijd PDF's met echte tekst. Wanneer u Inzoomen op de tekst, worden de randen van de tekens altijd scherp en duidelijk weergegeven, ongeacht hoe ver u Sluiten. De tekst is doorzoekbaar en kan altijd worden geselecteerd.
- Optical Character Recognition (OCR) tekst – Als u OCR uitvoert (alleen voor Revu eXtreme) kunnen raster- en vectorafbeeldingen worden vertaald naar doorzoekbare gegevens. Met andere woorden: OCR interpreteert de afbeeldingen op een gescande PDF en maakt daar bovenop een onzichtbare tekstlaag aan. In deze laag kunt u afbeeldingen doorzoeken, selecteren en markeren die geen echte tekst bevatten.
- Vectorkarakters – Maken door lijnsegmenten die worden gebruikt om de Vormen van elk karakter te tekenen. Dit gebeurt meestal wanneer de PDF is gemaakt vanuit CAD (vaak AutoCAD) of wanneer er een ander lettertype dan TrueType wordt gebruikt.
- Waarom gebruikt CAD geen TrueType-lettertypen om echte tekst te Maken? Het antwoord is dat AutoCAD ouder is dan Macintosh-, Windows- en TrueType-lettertypen. Ze moesten hun eigen lettertypesysteem maken, de zogenaamde SHX-lettertypen. SHX-lettertypen worden gedefinieerd met behulp van lijnsegmenten. Deze lijnsegmenten worden in plaats van tekstgegevens naar de PDF vertaald.
- Het gebruik van TrueType lettertypen in CAD heeft de voorkeur als PDF-bestanden worden aangemaakt. De Bluebeam plug-in voor AutoCAD zet TrueType lettertypen automatisch om in doorzoekbare tekst.
- Vector tekens zijn te herkennen aan hun grove omtrek als erop ingezoomd wordt. Deze grove omtrek wordt gemaakt door de lijnsegmenten waar elk teken uit bestaat.
- Grafische ontwerpprogramma's (bijv. Adobe Illustrator) kan ook vectortekens maken. Deze vectorkarakters vertonen echter duidelijke, scherpe randen wanneer er wordt ingezoomd.
- Rastertekens – Zoals eerder gezegd worden individuele pixels gebruikt om elk teken te definiëren.
Meer informatie
AutoCAD: PDF's maken met doorzoekbare tekst - Ontdek hoe u doorzoekbare PDF's maakt met AutoCAD.
Problemen oplossen
Revu 21
Revu 20
Documentverwerking
