PCOT関連の掲示板

PCOTの感想、質問、バグ報告受付 / 363

710 コメント
views
1 フォロー
363

ぬるっぽさん、ご回答ありがとうございます😄

質問1について
ぬるっぽさんの案、素晴らしいと思います!😆

翻訳1回目が「.?!'"」などで終了している文章は段落分け、それ以外はスペースで繋げて表示していただけると助かります!

質問2について
そうなんです、本にもよりますが、字下げで段落が表現されていることが多いです。
「ピリオドで改行されている場合は段落の終わり」というのは正しいです、が、たまに例外もあります。(話し言葉や説明など、"':で改行されているものがある)

素人意見ですが、「単語単位で座標を取得できる」とのことなので、

一行ずつ一番左の座標を取得、最も左の座標値を標準値とする
 ↓
標準値から右へズレている行は字下げされていると判定、改行し半角スペースを4ついれる(英文の字下げは通常4文字程度)

というのはいかがでしょうか??

画像1
画像2

この画像のように、洋書は、文章の始まり(左端)は揃っていて、終わり(右端)はズレているので、上の判定方法がもし使えたら、と思うのですが。

少しでも参考になれれば嬉しいです。

通報 ...