PCOT関連の掲示板

PCOTの感想、質問、バグ報告受付 / 609

710 コメント
views
1 フォロー
609
ぬるっぽ 2023/09/09 (土) 14:49:46 >> 604

ご回答ありがとうございました。
では、そのように実装します。ちょっとプライベートでバタバタしているので、いつリリース出来るかはちょっとお約束できませんが、可能な限り早く実装します。今しばらくお待ちください。

で、全角スペースなのですが、OCRでは全角含めスペースを読み取らないんです。
ややこしいので最初に詳しい説明を避けましたが、OCR自体の段落判定が甘く、そのまま表示すると行の途中で改行されてしまうので、段落を再現する処理をPCOT側で独自に座標を計算して実現している感じです。
この際に単語単位で一度文章をバラバラにして、再度再構築するのですが、再構築する際にスペースで区切るため、日本語などでは一字ずつスペースで区切られてしまう感じです。

なので、恐らく素で読み取った文章はどんな言語であれ、全角スペースは含まれないと思います(辞書登録で置換した場合は別ですが)

以上を踏まえて、ご要望の機能を実装しますのでしばらくお待ちください。

通報 ...