ラスターベースの PDF に関する問題

概要

PDF がラスターベースかベクターベースかを判断する方法と、これがオブジェクトへのスナップ機能やテキストを選択する機能にどのように影響するかについて説明します。

問題

  • 測定時にオブジェクトにスナップできません。
  • 「編集> PDF コンテンツ>テキストの編集」を使用してテキストを編集することはできません。
  • テキストを選択または検索することはできません。

なぜこのようなことが起こるのでしょうか?

これら両方の問題が発生する理由は、PDF がすべて同じ方法で作成されているわけではないからです。一見区別がつかないように見えても、一部の PDF には他の PDF よりも多くの情報が含まれています。

ページには線や文字が含まれているように見えますが、PDF 内でそれらを表す基礎となる要素は、コンテンツにスナップしたり、テキストを検索およびテキストを選択するために必要なベクター線やテキスト要素ではない可能性があります。

ラスターコンテンツとベクターコンテンツ

PDF 内のラスター コンテンツとベクター コンテンツの違いを見てみましょう。

ラスターPDF ベクターPDF

ラスター

ラスター画像は、ピクセルと呼ばれる一連の正方形のドットから作成されます。ラスター PDF の一例としては、紙をスキャンして作成されたファイルがあります。スキャンされた PDF は、ページのビットマップ画像 (JPEG や TIFF など) を作成し、その画像を PDF ページに配置することによって作成されます。つまり、スキャンされた PDF またはラスター PDF には、線とテキストを表すドットのグリッドのみが含まれ、コンピューターが認識できる線やテキストは実際には含まれません。したがって、「コンテンツにスナップ」機能がスナップする線はなく選択または検索するテキストもありません。

PDF がラスター画像であるかスキャンであるかを判断するには、ズームインするだけです。ページ上の線や文字は、四角い点のグリッドに変わったり、ぼやけたりします。

ベクトル

ベクターベースの PDF では、線分を使用してページ上のすべてのジオメトリを定義します。CAD (コンピュータ支援設計) から作成された PDF のほとんどはベクターベースです。ベクター PDF には作業しやすいデータが多く含まれているため、通常はラスター PDF よりもベクター PDF が好まれます。スキャンから PDF を作成するのではなく、常にソースから作成されたベクター PDF で作業するようにしてください。

ベクター PDF を使用する利点は、図面の詳細を表示するためにズームインしても、ジオメトリの表示が鮮明なままであることです。そのため、コンテンツにスナップを使用して PDF 内のベクター線にスナップできるため、ベクター PDF では測定とテイクオフ(必要物資見積もり)工程 (およびそれらの較正) が正確になります。

テキスト(X)

テキストは PDF 内の独立したコンテンツの種類です。PDF にテキスト文字が表示される場合がありますが、それらの文字は必ずしも PDF テキスト要素ではありません。代わりに、ラスター ドットまたはベクター線分によって定義される場合があります。これらの要素はテキストのように見えますが、コンピューターがテキストとして認識できるようにするデータは含まれていません。したがって、このタイプの「テキスト」は本質的には選択、検索、または編集できない画像です。

混乱を避けるため、「文字」は一般的なテキストを指し、「テキスト」は PDF テキスト要素、つまり「実際のテキスト」を指します。

詳細に入る前に、PDF にテキストが含まれているかどうかを確認するための簡単なテストがあります。メニューバーから、 [編集] > [PDF コンテンツ] > [すべてのテキストを選択]に移動します (Revu 2017 以前では、 [編集] > [選択] > [すべてのテキストを選択] に移動します)。PDF 内のすべてのテキストが青色で蛍光ペンされます。文字が蛍光ペン表示されない場合は、ラスター画像またはベクター画像のいずれかです。

強調表示されたテキスト
  1. PDFテキスト要素(またはリアルテキスト):より応答性の高いコンテンツとなるため、PDFでは常に推奨されます。文字ベースのプログラム(例: Word や Excel)から作成されたPDFには、ほとんどの場合、実際のテキストが含まれています。テキストをズームインすると、どんなにズームインしても文字の輪郭は常にシャープで鮮明に見えます。テキストは検索可能で、いつでも選択可能です。
  2. 光学文字認識 (OCR) — Revu eXtreme のみで OCR を実行すると、ラスター画像やベクター画像を検索可能なデータに変換できます。つまり、OCR はスキャンされた PDF 上の画像を解釈し、それらの上に目に見えないテキストレイヤーを作成します。このレイヤーを使用すると、テキスト情報がない画像を検索、選択、蛍光ペンで強調表示できます。
  3. ベクター文字 – 各文字の図形を描画するために使用される線分で構成されます。これは通常、PDF が CAD (多くは AutoCAD)から作成されている場合、または TrueType 以外のフォントが使用されている場合に発生します。
    • CAD では実際のテキストを作成するのに TrueType フォントを使用しないのはなぜですか?答えは、AutoCAD が Macintosh、窓、TrueType フォントよりも古いからです。SHX フォントと呼ばれる独自のフォント システムを作成する必要がありました。SHX フォントは線分を使用して定義されます。これらの線分はテキスト データではなく PDF に変換されます。
    • PDF を作成する場合は、CAD で TrueType フォントを使用することをお勧めします。AutoCAD 用の Bluebeam プラグインは、TrueType フォントを検索可能なテキストに自動的に変換します。
    • ベクター文字は、ズームインしたときにゴツゴツとした外観になるのが特徴です。これらの塊は、各文字を構成する線分によって作成されます。
    • グラフィックデザインプログラム(例:Adobe Illustrator などのソフトウェアを使用して、ベクター文字も作成できます。ただし、これらのベクター文字は、ズームインすると鮮明でシャープなエッジが表示されます。
  4. ラスタ文字 – 前述のとおり、個々のピクセルを使用して各文字を定義します。

それぞれテキスト、ベクター、ラスターである文字の例。

詳細情報

AutoCAD: 検索可能なテキストを含む PDF を作成する- AutoCAD から検索可能な PDF を作成する方法を学習します。

トラブルシューティング

Revu 21

Revu 20

文書処理

PDF がラスターベースかベクターベースかを判断する方法と、これがオブジェクトへのスナップ機能やテキストを選択する機能にどのように影響するかについて説明します。