OCR
光学文字認識 (OCR) または文字認識では、スキャンされた PDF ドキュメントを検索可能なデータに変換できます。
認証またはデジタル署名された PDF では、OCR を実行できません。
メモ: OCR は、Bluebeam Revu eXtreme でのみ利用できます。OCR 機能、この機能のメニューやツールバーの項目は、Bluebeam Revu Standard や Bluebeam Revu CAD には表示されません。
1 つのドキュメントでの OCR の実行- OCR を実行するドキュメントを開きます。
- [ドキュメント] > [OCR] の順に進むか、CTRL + SHIFT + O を押します。[OCR] ダイアログボックスが表示されます。
- OCR 処理で使用する言語を [認識言語] の下に表示します。デフォルトでは米語ライブラリがロードされます。他のライブラリを追加するには、[追加] をクリックします。ライブラリを削除するには、削除したいライブラリを選択して [削除] をクリックします。同じ文書で複数のライブラリを使用できます。
必要に応じて、[OCR の構成] オプションを設定します。
- スキューを修正する:スキャンした文書の角度偏差の修正を有効にします。
- 方向を検出する:必要に応じて、各ページの方向 (90 度、180 度、270 度) の検出および修正を有効にします。
- 画像と図面のテキストを検出する:グラフィック内のテキストの検出を有効にします。
- マークアップを回転する:[スキューを修正する] が有効になっている場合、このオプションを使用すると既存のマークアップが調整されるため、スキュー修正されたテキストまたはイメージとともにマークアップが整列されます。
- ベクトルページをスキップ:ベクトルコンテンツのあるページのスキップ処理を有効にします。
ページのチャンクサイズ:OCR エンジンに 1 回で送信する最大ページ数を決定するときに使用します。チャンクサイズを増やすと速度が上がりますが、より多くのコンピュータリソースも消費されます。
メモ: ページ数が多かったり、実際のファイルサイズが大きいまたは大型の図面だったりする PDF で OCR ジョブを実行する場合、[ページのチャンクサイズ] を有効にして 1 に設定することをお勧めします。OCR を PDF で実行しても結果が得られなかった場合、[ページのチャンクサイズ] を 1 にして再度実行すると、問題を修正できることがあります。
- [最大ベクトルサイズ]:OCR の処理中に分析される最大ベクトルサイズを設定するときに使用します。この設定より大きいベクトルは、前処理で破棄されます。この値を減らせば速度は上がりますが、テキストサイズが大きくなると (たとえば、フォントサイズが大きい場合) 、意図せず処理が行われない可能性があります。
- 最適化対象:選択した文書タイプの OCR 処理を最適化するときに使用します。[CAD 図面] の設定では、たとえばテキスト形式などは無視される傾向がありますが、[テキスト文書] 設定の場合はそのようなことはありません。
[ページの範囲] を選択するには、[ページ] メニューをクリックして、次から選択します。
- すべてのページ:範囲をすべてのページに設定します。
- 現在:範囲を現在のページのみに設定します。現在のページ番号がかっこ内に表示されます。たとえば、現在のページがページ 2 の場合、現在のページ (2) となります。
- 選択済み:現在選択しているページに範囲を設定します。このオプションは、コマンドを呼び出す前にページが選択されている場合にのみ表示されます。
- [OK] をクリックして OCR を実行します。
複数のドキュメントでの OCR の実行[ファイル] > [バッチ] > [OCR] の順に進みます。[バッチ:OCR] ダイアログボックスが表示されます。
次のいずれか (または両方) の方法でドキュメントを追加します。
- 現在 Revu で開いているすべての PDF を追加するには、[開いているファイルの追加] をクリックします。
- ローカルドライブまたはネットワークドライブからファイルを選択するには、[追加] をクリックします。
[ページの範囲] を選択するには、[ページ] メニューをクリックして、次から選択します。
- すべてのページ:範囲をすべてのページに設定します。
- [適用する対象] メニューから、[偶数ページのみ]、[奇数ページのみ] または [偶数ページと奇数ページ] から選択し、また [横ページ]、[縦ページ] または [横ページと縦ページ] から選択します。ここでの選択はフィルタの形成と連動するため、処理するページはすべて、選択した両方の条件を満たす必要があります。
- [ファイルのリスト] で次の PDF を選択し、ステップ 3 と 4 を繰り返して各 PDF の [ページの範囲] オプションと [ページのフィルタ] オプションを設定します。
[OK] をクリックします。[OCR] ダイアログボックスが表示されます。
- OCR 処理で使用する言語を [認識言語] の下に表示します。デフォルトでは米語ライブラリがロードされます。他のライブラリを追加するには、[追加] をクリックします。ライブラリを削除するには、削除したいライブラリを選択して [削除] をクリックします。同じ文書で複数のライブラリを使用できます。
必要に応じて、[OCR の構成] オプションを設定します。
- スキューを修正する:スキャンした文書の角度偏差の修正を有効にします。
- 方向を検出する:必要に応じて、各ページの方向 (90 度、180 度、270 度) の検出および修正を有効にします。
- 画像と図面のテキストを検出する:グラフィック内のテキストの検出を有効にします。
- マークアップを回転する:[スキューを修正する] が有効になっている場合、このオプションを使用すると既存のマークアップが調整されるため、スキュー修正されたテキストまたはイメージとともにマークアップが整列されます。
- ベクトルページをスキップ:ベクトルコンテンツのあるページのスキップ処理を有効にします。
ページのチャンクサイズ:OCR エンジンに 1 回で送信する最大ページ数を決定するときに使用します。チャンクサイズを増やすと速度が上がりますが、より多くのコンピュータリソースも消費されます。
メモ: ページ数が多かったり、実際のファイルサイズが大きいまたは大型の図面だったりする PDF で OCR ジョブを実行する場合、[ページのチャンクサイズ] を有効にして 1 に設定することをお勧めします。OCR を PDF で実行しても結果が得られなかった場合、[ページのチャンクサイズ] を 1 にして再度実行すると、問題を修正できることがあります。
- [最大ベクトルサイズ]:OCR の処理中に分析される最大ベクトルサイズを設定するときに使用します。この設定より大きいベクトルは、前処理で破棄されます。この値を減らせば速度は上がりますが、テキストサイズが大きくなると (たとえば、フォントサイズが大きい場合) 、意図せず処理が行われない可能性があります。
- 最適化対象:選択した文書タイプの OCR 処理を最適化するときに使用します。[CAD 図面] の設定では、たとえばテキスト形式などは無視される傾向がありますが、[テキスト文書] 設定の場合はそのようなことはありません。
- [OK] をクリックして OCR を実行します。
関連トピック
スキャナまたはカメラからの PDF の作成