PCOT関連の掲示板

PCOTの感想、質問、バグ報告受付 / 567

710 コメント
views
1 フォロー
567
ポエムスクリプト 2023/04/02 (日) 16:58:53 be786@604fe

AI翻訳のように 画像の2値化も AIにならないのでしょうか?(無茶振り)

有難く使用させて頂いております
「半透明のメッセージウィンドウで 背景が透けている」ゲームの場合、読み取り精度が悪く 非常に難儀しております
判る範囲で確認したところ、OCR前のグレイスケール・2値化の段階で躓いているようです

グレイスケール : 人間には読めても OCRが文字を拾うのは苦手っぽい
2値化      : 都度閾値を変えなければ画像潰れをおこすような状況に遭遇すると面倒

AIによる2値化ではありませんが、他人様のブログで閾値を自動算出している例を発見しました
 2値化処理 ー 東洋大学総合情報学
  http://makotomurakami.com/blog/2020/08/06/6534/
 自分はおそらく ブログの内容を半分も理解できてないと思いますが・・・(滝汗)
 アドレス貼ることが問題になるようでしたら 削除してください

ご一考頂けると幸いです

なお、Windows11 による Windows10 OCRの利用は 「言語パック」 のインストールで行けました

通報 ...
  • 568
    ぬるっぽ 2023/04/02 (日) 23:36:29 修正 >> 567

    PCOTをご使用いただき、ありがとうございます。

    お問合せの件についてですが、画像の2値化をAIで行うのは難しいです・・・すみません。
    代わりに、PCOTには画像加工機能を搭載しています。
    ご提示頂いたリンク先にある自動的に閾値を取得する方法は「大津の二値化」と呼ばれる手法で、PCOTの画像加工にも実装してあります。
    他にも、明度の増減、彩度の増減など色々な加工が出来るようになっています。
    そしてこれらの画像加工の設定を設定ファイルに保存することで、OCR前に画像加工を行い、読取精度を向上させることが可能です。
    本当はAIによる文字抽出を自動で行えるのが理想ですが、残念ながら私には難しそうです・・・。

    それと、大津の二値化は万能そうに見えて、人の目にはよく見えるのですがOCRが上手く読み取ってくれない事が多々ありまして・・・。

    参考画像1
    画像1

    ちゃんと使いこなすとかなり読取精度が上がるので、是非使いこなして頂きたいです。(kの字がおかしなことになってますが・・・)

    参考画像2
    画像1

    やり方を説明するとかなり長くなってしまいますので、やまチャンネルさんが紹介してくださった以下のリンクの動画から確認してください。
    画像加工説明の所まで動画を飛ばしているので再生するだけでOKです。

    PCOTの画像加工の紹介動画
    https://youtu.be/hvPRcvR8bCo?t=854

    以上、ご参考になれば幸いです。

    最後に、Windows11でのWindows10 OCRの動作報告ありがとうございました!