ラスターベースの PDF に関する問題

概要

PDF がラスターベースかベクターベースかを判断する方法と、これがオブジェクトへのスナップ機能やテキストを選択する機能にどのように影響するかについて説明します。

問題

測定時にオブジェクトにスナップできません。
「編集> PDF コンテンツ>テキストの編集」を使用してテキストを編集することはできません。
テキストを選択または検索することはできません。

なぜこのようなことが起こるのでしょうか?

これら両方の問題が発生する理由は、PDF がすべて同じ方法で作成されているわけではないからです。一見区別がつかないように見えても、一部の PDF には他の PDF よりも多くの情報が含まれています。

ページには線や文字が含まれているように見えますが、PDF 内でそれらを表す基礎となる要素は、コンテンツにスナップしたり、テキストを検索およびテキストを選択するために必要なベクター線やテキスト要素ではない可能性があります。

ラスターコンテンツとベクターコンテンツ

PDF 内のラスターコンテンツとベクターコンテンツの違いを見てみましょう。

ラスターPDF	ベクターPDF

ラスター

ラスター画像は、ピクセルと呼ばれる一連の正方形のドットから作成されます。ラスター PDF の一例としては、紙をスキャンして作成されたファイルがあります。スキャンされた PDF は、ページのビットマップ画像 (JPEG や TIFF など) を作成し、その画像を PDF ページに配置することによって作成されます。つまり、スキャンされた PDF またはラスター PDF には、線とテキストを表すドットのグリッドのみが含まれ、コンピューターが認識できる線やテキストは実際には含まれません。したがって、「コンテンツにスナップ」機能がスナップする線はなく、選択または検索するテキストもありません。

PDF がラスター画像であるかスキャンであるかを判断するには、ズームインするだけです。ページ上の線や文字は、四角い点のグリッドに変わったり、ぼやけたりします。

ベクトル

ベクターベースの PDF では、線分を使用してページ上のすべてのジオメトリを定義します。CAD (コンピュータ支援設計) から作成された PDF のほとんどはベクターベースです。ベクター PDF には作業しやすいデータが多く含まれているため、通常はラスター PDF よりもベクター PDF が好まれます。スキャンから PDF を作成するのではなく、常にソースから作成されたベクター PDF で作業するようにしてください。

ベクター PDF を使用する利点は、図面の詳細を表示するためにズームインしても、ジオメトリの表示が鮮明なままであることです。そのため、コンテンツにスナップを使用して PDF 内のベクター線にスナップできるため、ベクター PDF では測定とテイクオフ（必要物資見積もり）工程 (およびそれらの較正) が正確になります。

テキスト(X)

テキストは PDF 内の独立したコンテンツの種類です。PDF にテキスト文字が表示される場合がありますが、それらの文字は必ずしも PDF テキスト要素ではありません。代わりに、ラスタードットまたはベクター線分によって定義される場合があります。これらの要素はテキストのように見えますが、コンピューターがテキストとして認識できるようにするデータは含まれていません。したがって、このタイプの「テキスト」は本質的には選択、検索、または編集できない画像です。

混乱を避けるため、「文字」は一般的なテキストを指し、「テキスト」は PDF テキスト要素、つまり「実際のテキスト」を指します。

詳細に入る前に、PDFにテキストが含まれているかどうかを判断する簡単なテストがあります。メニューバーから、[編集] > [PDF コンテンツ] > [すべてのテキストを選択] に進みます。PDF内のすべてのテキストは青色の蛍光ペンで強調されるはずです。文字が蛍光ペンされない場合、それらはラスタ画像かベクター画像です。

強調表示されたテキスト

PDF テキスト要素（または実際のテキスト）：より応答性の高いコンテンツになるため、PDF では常に推奨されます。文字ベースのプログラム（例：Word や Excel）から作成された PDF は、ほぼ常に実際のテキストを含む PDF を作成します。テキストをズームインすると、どれだけズームインしても、文字の縁は常にシャープで鮮明に見えます。テキストは検索可能で、常に選択できます。
光学文字認識 (OCR) テキスト：OCR を実行すると (Revu eXtreme のみ)、ラスター画像やベクター画像を検索可能なデータに変換できます。つまり、OCR はスキャンされた PDF 上の画像を解釈し、その上に非表示のテキストレイヤーを作成します。このレイヤーにより、実際のテキストを持たない画像を検索、選択、蛍光ペンすることができます。
ベクター文字：各文字の図形を描画するために使用される線によって作成されます。これは通常、PDF が CAD (多くの場合 AutoCAD) から作成された場合、または非 TrueType フォントが使用されている場合に発生します。
- CAD では実際のテキストを作成するのに TrueType フォントを使用しないのはなぜですか?答えは、AutoCAD が Macintosh、窓、TrueType フォントよりも古いからです。SHX フォントと呼ばれる独自のフォントシステムを作成する必要がありました。SHX フォントは線分を使用して定義されます。これらの線分はテキストデータではなく PDF に変換されます。
- PDF を作成する場合は、CAD で TrueType フォントを使用することをお勧めします。AutoCAD 用の Bluebeam プラグインは、TrueType フォントを検索可能なテキストに自動的に変換します。
- ベクター文字は、ズームインしたときにゴツゴツとした外観になるのが特徴です。これらの塊は、各文字を構成する線分によって作成されます。
- グラフィックデザインプログラム（例：Adobe Illustrator などのソフトウェアを使用して、ベクター文字も作成できます。ただし、これらのベクター文字は、ズームインすると鮮明でシャープなエッジが表示されます。
「ラスター文字」：前述のとおり、個々のピクセルを使用して各文字を定義します。

それぞれテキスト、ベクター、ラスターである文字の例。

詳細情報

AutoCAD: 検索可能なテキストを含む PDF を作成する- AutoCAD から検索可能な PDF を作成する方法を学習します。

トラブルシューティング

Revu 21

Revu 20

文書処理