OCR PDF
スキャンされたPDFや画像ベースのドキュメントを、検索・選択可能なテキストに数秒で変換します。
- スキャンされたPDFを検索可能にして、コピーできる状態にします。
- ブラウザ上でファイルを処理します。インストール不要、アカウント不要。
- ファイルは転送中に暗号化され、処理後に削除されます。
ファイルをアップロードする
OCRを選ぶ理由
デスクトップソフトウェアを購入することなく、スキャンしたPDFをクリーンで検索可能なドキュメントに変換できます。
検索可能、選択可能、共有可能
OCRは、スキャンされたページ上のテキスト画像をコンピューターが読み取れる実際の文字に変換します。PDFがOCR処理されると、内容を検索したり、メールやメモに行をコピーしたり、スクリーンリーダーでコンテンツを読み上げさせることができます。元のレイアウトはそのまま保持されるため、アップロードした文書と同じ見た目を維持します。
ファイルがレシートの写真であれ、裁判所の書類、研究論文、古い書籍のスキャンであれ、OCRはピクセルの中に閉じ込められた言葉を解放します。当社のエディターと組み合わせて、誤字の修正、機密情報の墨消し、新しいドキュメントへの引用の抜き出しなどが行えます。すべてオンラインで処理されるため、ノートパソコン、タブレット、スマートフォンをまたいで作業を続けることができます。
ソフトウェア不要の高精度OCR
PrintFriendlyはクラウド上で最新のOCRエンジンを稼働させているため、インストーラー、ライセンスキー、重いデスクトップアプリは不要です。PDFをドロップして少し待つだけで、通常のテキストPDFと同様に扱えるバージョンがダウンロードできます。サーバー側で処理を行うため、古いノートパソコンやChromebookでも長いドキュメントのOCR処理が可能です。
精度はスキャンの品質に依存しますが、当社のエンジンは書籍、契約書、請求書、フォームなどの印刷テキストを確実に処理します。ページの順序、ページ番号、元のページサイズを保持するため、出力結果はそのまま既存のワークフローに取り込むことができます。ゾーン、カラム、トレーニングファイルの調整は一切不要です。
PrintFriendlyにおけるOCRの仕組み
ページ上部のアップロードボックスをクリックするか、スキャンされたPDFをドラッグ&ドロップしてください。ファイルは暗号化された接続を通じて、処理サーバーへ直接アップロードされます。インストールは不要で、開始するためのアカウントも必要ありません。
当社のOCRエンジンはすべてのページをスキャンし、印刷されたテキストを認識して、各ページ画像の背後に実際のテキストレイヤーを持つPDFを再構築します。視覚的なレイアウトはそのまま保たれるため、文書は元のスキャンと同じ見た目を維持しますが、テキストはコンピューターで読み取れるようになります。
処理が完了すると、ダウンロードページに移動します。検索可能なPDFをコンピューターに保存するか、共有リンクをコピーしてください。処理済みのファイルは間もなく当社のサーバーから削除されるため、ドキュメントを引き続き管理できます。
PDFにOCRを実行する理由
OCRは、テキストのフラットな画像を検索可能でアクセシブルなドキュメントに変換します。PDFに実際のテキストレイヤーが追加されると、フレーズを数秒で検索したり、別のドキュメントに引用を貼り付けたり、スクリーンリーダーを活用したりすることができます。これは、紙の束と実用的なファイルの違いです。
高速かつ高精度
当社のクラウドOCRエンジンは、ほとんどのPDFを数秒で処理し、密度の高い複数ページのドキュメントも問題なく対応します。領収書、契約書、書籍、記事、フォームなど、印刷された英語テキストを高精度で認識します。ぼやけた推測ではなく、クリーンでモダンなテキストレイヤーを提供します。
安全かつプライベート
アップロードはHTTPSで転送され、ファイルは独立したジョブで処理されます。OCRが完了し、結果をダウンロードした後、処理済みのファイルはサーバーから削除されます。お客様のコンテンツを確認、共有、またはトレーニングに使用することは一切ありません。
アカウント不要
PDFをドロップして開始するだけです。処理前にサインアップは必要ありません。サインインが必要なのは、後で完成したファイルをダウンロードしたい場合のみです。これにより、登録フォームなしでツールを保護しながら作業を守ることができます。
どこでも使える
OCRはお使いのノートパソコンではなく当社のサーバーで実行されるため、Mac、Windows、Chromebook、iPad、Androidで同様に動作します。プラグイン、ドライバー、および最新ブラウザ以外の最低システム要件は一切不要です。
よくある質問
当社のサービスに関するよくある質問と回答をご覧ください。その他ご不明な点がございましたら、お気軽にお問い合わせください。
OCRとは何ですか?PDFに対して何をしますか?
OCRは光学文字認識(Optical Character Recognition)の略です。各ページのテキスト画像を解析し、実際の文字と単語を識別するプロセスです。OCR処理後もPDFの見た目は変わりませんが、検索、選択、コピー、およびスクリーンリーダーによる読み上げを可能にする非表示のテキストレイヤーが追加されます。どのようなPDFがOCRの恩恵を受けますか?
スキャン、写真、ファックス、またはスクリーンショットから作成されたPDF。ファイルを開いて1つの単語もハイライトできない場合、ほぼ確実にスキャンであり、OCRが役立ちます。Word、Google Docs、またはその他のデジタルソースから作成されたPDFは通常すでにテキストレイヤーを持っており、OCRは必要ありません。ファイルは安全ですか?
はい。アップロードは暗号化されたHTTPS接続を介して行われ、ファイルは独立したジョブで処理されます。処理されたファイルはダウンロード後まもなくサーバーから削除されます。お客様のドキュメントを閲覧または保持することはありません。OCRエンジンはどの言語をサポートしていますか?
現在、このツールは英語でOCRを実行します。ほとんどが英語で、時折英語以外の単語が含まれるドキュメントも問題なく処理されます。追加言語のサポートはロードマップに含まれています。OCRはPDFの見た目を変えますか?
いいえ。ページのサイズ、順序、および表示レイアウトはそのまま維持されます。OCRはページ画像の背後に非表示のテキストレイヤーを追加します。ファイルを表示または印刷すると、アップロードしたスキャンとまったく同じように見えます。ファイルサイズの制限はありますか?
100 MBまでのファイルに対応しています。非常に長いまたは高密度なドキュメントの場合、OCRがすべてのページを読み取る必要があるため、処理に少し時間がかかることがあります。