オープンソースなOCRソフトTesseractを試してみた。

コンピュータ

私の環境は64bitなので、
tesseract-ocr-w64-setup-v4.1.0.20190314 (rc1) (64 bit) resp.
をクリックしダウンロード。

日本語の辞書データ?が必要ですので以下のサイトからダウンロード
tesseract-ocr/tessdata
Contribute to tesseract-ocr/tessdata development by creating an account on GitHub.

jpn_vert.traineddata
jpn.traineddata
の2つのファイルをダウンロードしをC:\Program Files\Tesseract-OCR\tessdataにコピー

コマンドプロンプトから以下のコマンドを実行し対応言語を確認てみます。
"c:\Program Files\Tesseract-OCR\tesseract.exe" --list-langs

使い方
"c:\Program Files\Tesseract-OCR\tesseract.exe" 画像ファイルのパス 出力テキストファイルのパス -l jpn

TesseractはCUIなコマンドですのでPowerShellから呼び出すスクリプトを作成してみました。
スクリプト実行すると当サイトのロゴを文字認識して出力してくれます。

結果

ブログランキング参加中
にほんブログ村 PC家電ブログ 自作PCへ
にほんブログ村
自作PCランキング
自作PCランキング
ブログサークル
ブログサークル
ブログにフォーカスしたコミュニティーサービス(SNS)。同じ趣味の仲間とつながろう!

免責事項

当サイトの情報・資料の掲載は注意を払っておりますが、掲載された情報の内容の正確性については一切保証致しません。
また、当サイトに掲載された情報・資料を利用、使用、ダウンロード等の行為で生じたあらゆる損害等に関して、理由の如何に関わらず当方は一切責任を負いません。

コンピュータ
スポンサーリンク
シェアする
八 四をフォローする
迷惑堂本舗

コメント