Tech-JP

技術情報とインターネットガイド

画像や PDF を編集可能なテキストに変換する OCR プログラム

スキャンした文書からテキストを抽出し、画像、ファックス、コピーを編集可能な Word ファイルに変換するサイトと無料プログラム

PDF OCR

OCR Optical Character Recognition (光学式文字認識) の頭字語で、 紙の文書を PDF に変換する その他の形式では、通常のテキスト プログラム (Microsoft Word など) で編集します。 したがって、技術的な詳細に立ち入ることなく、OCR ソフトウェアを使用すると、次のことが可能になります。 書かれたシートの画像を取り、それをデジタル文書に変換する、編集したり、電子メールですばやく共有したりできます。

このタイプのソフトウェアは、 スキャナ、よく見られる すぐに使えるドキュメントの代わりに画像が生成されます; OCR のおかげで、JPEG 画像またはその他のグラフィック形式で書かれたテキストを認識して読み取り可能なテキストを取得し、後でデジタル ドキュメント形式 (PDF または Word) で保存できます。

この記事では、 紙の文書を変換するための最高の無料プログラムとウェブサイト (印刷、ファックス、ファイルなど) デジタル PDF ドキュメントまたは編集可能なファイル (Microsoft Word または同様のプログラムを使用)。

また読む: OCR アプリを使用して Android の画像からテキストを認識して抽出する

OCR 変換プログラム

PDF24クリエイター

画像や写真を紙に変換し、PDF を編集可能なテキストに変換する最初のプログラムは次のとおりです。 PDF24クリエイター、公式サイトからダウンロード可能。
PDF24 OCR

この強力な PDF スイートを使用すると、いくつかの簡単な手順で、紙のテキスト ドキュメントを編集可能な PDF に変換できます。 このプログラムを使用するには、PDF24 アプリを開き、メニューを押します テキストを認識する、押し上げます 追加ファイル そして最後に押し上げます 始める スキャンした文字の認識を開始します。 変換の最後に、上部にある[ファイルを保存]を押して、スキャンしたテキストを含む新しい PDF ファイルを保存します。

マイクロソフト ワンノート

OCR を介して写真をドキュメントに変換するために PC で使用できるもう 1 つの有効なプログラムは、次のプログラムです。 マイクロソフト ワンノート、Microsoft Store から無料でダウンロードできます。
OneNote

画像からテキストを抽出するには、まず上部にある をクリックして、プログラムのメモの 1 つに画像を追加します。 入れる そしてメニューを押す 画像.
ノートページに画像を追加した後、右クリックして音声を使用します 画像からテキストをコピー プログラムに含まれる OCR を開始します。 画像にインポートするページがさらに含まれている場合は、音声を使用することもできます 印刷物のすべてのページからテキストをコピーする、OCR ですべてのテキストを取得するようにします。

コグニティブ OpenOCR

代わりに、OCR を使用する無料のオープン ソース プログラムを探している場合は、試してみることをお勧めします。 コグニティブ OpenOCR (楔形文字).
楔形文字

Cognitive OpenOCR (Cuneiform) は、光学式文字認識 (OCR) を実行できるオープン ソース プログラムです。 画像を編集可能なテキスト ドキュメントに変換する Word または他のプログラムで。
楔形文字は、以下を含む23の言語をサポートしています イタリア人 また、プリンター、ファックス、およびコピーからのテキストを認識するための特別なアルゴリズムを備えています。 テキスト、表、画像のブロックを自動的に認識し、ページのレイアウトを完全に維持します。
使用するには、認識ウィザードをクリックし、ガイド付きの手順に従って画像をインポートし、デジタル テキスト ファイルにすばやく変換します。

OCR変換サイト

Googleドキュメント

紙や PDF を編集可能なテキストに変換するサイトを使用したい場合は、 Googleドキュメント、Google が提供する無料のオフィス スイートで、公式 Web サイトからアクセスできます。
Googleドキュメント

この可能性を利用するには、まず Google ドライブにアクセスし、右上の歯車アイコンを押して、メニューを開きます 設定 表示されるウィンドウで、アイテムをアクティブ化します アップロードしたファイルを Google ドキュメント エディター形式に変換する.
ガイドにもあるように、PDF ドキュメントまたは画像を Google ドキュメントにアップロードするだけで、サイトが提供するツールを使用して変更でき、OCR 変換が自動的に行われます。 Google ドキュメントで PDF または画像からテキストを抽出する.

onlineocr.net

OCR でシートを変換する別の有効な Web サービスは次のとおりです。 onlineocr.net.
無料OCR

このサービスを使用するには、上を押して画像ファイルを読み込みます ファイルを選択、テキストの言語を選択し、最終的な画像ファイルの形式 (Word または Excel) を選択して、最後に キーを押します。 変換、アップロードされた画像のOCRから作成された編集可能なテキストドキュメントをダウンロードできます。

私は変換します

紙や PDF を編集可能なテキストに変換するために使用することをお勧めする別の Web サービスは次のとおりです。 私は変換します.
OCR を変換

このサービスを使用すると、ボタンを押すだけで 10 ページを無料で変換できます。 ファイルを選択 (ただし、クラウドから画像ファイルにアクセスすることもできます)、テキスト認識を待ち、最終的にドキュメントのダウンロードを開始します。ドキュメントは、Word、PDF、またはその他の既知のテキスト形式で保存できます。

OCR に関するその他のサイトとプログラム

上記のサイトとプログラムは、OCR を使用する必要があるあらゆる種類のタスクを満たすことができますが、インターネット上では、OCR 用の新しいツール、ツール、およびサイトを常に見つけることができます。 有効な代替手段を探している場合は、以下の情報を見てみましょう。

  • Google Keep で写真のテキストを書き起こす PDF では機能しませんが、最も簡単な方法です。
  • シンプルOCR は、紙に書かれた編集可能なテキストを作成し、光学式文字認識を使用してコンピューターにスキャンできるシンプルで基本的なプログラムです。 SimpleOCR を使用すると、あらゆる紙文書を編集可能な電子テキストに変換して、Word でも使用できます。
  • 簡単画面OCR は、Windows 10 および Windows 7 用の無料プログラムで、画像やスクリーンショットからテキストを抽出してキャプチャできます。 Easy Screen OCR (光学式文字認識) ツールは、スクリーンショットをキャプチャしてテキストに変換することができます。 画像、ビデオ、Web サイト、ドキュメントからテキストを抽出できます。 高い認識精度を保証する Google OCR を搭載したこの無料プログラムは、100 以上の言語をサポートしています。
  • Boxoft 無料 OCR コンバーター 英語、フランス語、ドイツ語、イタリア語、オランダ語、スペイン語、ポルトガル語などを含む複数の言語で、あらゆる種類の画像 (スキャンした紙の画像を含む) からテキストを抽出できるもう 1 つの優れた無料プログラムです。 画像だけでなく、ドキュメントのハード コピーをスキャンして、編集可能なテキストに変換することもできます。
  • 新しいOCR 現在、画像や写真からのファイルからのテキスト抽出のみを提供していますが、テキストから正しい翻訳を取得するのにも役立つ複数の認識言語の設定など、多くのオンライン OCR サイトが提供していない他の機能をサポートしています。 画像が傾いている場合は、動的に回転させることもできます。
  • OCR.スペース これは間違いなく、私たちが見つけたより堅牢なオプションの 1 つであり、PNG、JPG、および PDF に加えて WEBP ファイル形式もサポートする最高の OCR ツールの 1 つです。 また、ファイルをアップロードする必要はありません。オンライン画像の URL を使用できます。 その他の機能には、自動回転、領収書のスキャン、テーブルの認識、自動サイズ変更があります。 抽出されたテキストは、PDF または JSON ファイルとして保存することもできます。
  • ファインリーダーオンライン は、画像をテキスト ファイルに変換したり、PDF ファイルを Word ファイルに変換したりするための Web サイトで、いつでも編集可能です。 この最後の機能である .pdf から .doc へのファイルの変換は、他の特定のソフトウェアでも実行できます。 PDFファイルを編集するには. テキスト ファイルに変換された画像とは、この場合、通常のスキャナーの管理プログラムを使用してスキャンし、jpeg、gif、bmp、または tiff ファイルで保存したページを意味します。 サイトを使用するには、登録が必要で、任意の言語で書かれたファイルの変換が認識されます。 イタリア語を含む.
  • OCR から Word は、PDF またはスキャンしたドキュメントからテキストを抽出できるシンプルで強力なプログラムです。 抽出されたテキストは、Word で編集できます。
  • Capture2Text 画像からテキストを簡単にコピーできるプログラムで、非常にシンプルなインターフェースを使用できます

選択する前に、それらをすべて試してみましょう。これにより、画像を完全なデジタル ドキュメントに簡単に変換できるようになります。

結論

これらのプログラムのパフォーマンスは、認識したい画像の品質と使用するスキャナーの感度に大きく依存します。同じように再現されたテキストから、単語が 1 つも認識されない場合まであります。
すべてのプログラムと Web サイトは非常にうまく機能しますが、OCR の能力は、これらの高度なツールに供給される画像の品質に大きく依存します。

別のガイドで、その方法を見てきました Chrome を使用して、テキストをコピーしてインターネット上の写真、画像、動画に貼り付けます.
代わりに、PC 上のスキャナー用の有効なプログラムを探している場合は、ガイドを読むことができます Windows PC でスキャナーを使用するための最適なプログラム.


コメントを残す 0

あなたのメールアドレスが公開されることはありません。 必須フィールドは、マークされています *