-
-
Notifications
You must be signed in to change notification settings - Fork 2.9k
Open
Labels
bugSomething isn't workingSomething isn't working
Description
在提问之前...
- 我已经尝试了PDFMathTranslate-next,并在PDFMathTranslate-next提交了issue
- 我已经搜索了现有的 issues
- 我在提问题之前至少花费了 5 分钟来思考和准备
- 我已经认真且完整的阅读了 wiki
- 我已经认真检查了问题和网络环境无关(包括但不限于Google不可用,模型下载失败)
使用的环境
- **OS**: Microsoft Windows 10 家庭版 22H2 (内部版本19045.6466)
- **pdf2zh**: v1.9.11请选择安装方式
exe
描述你的问题
翻译STM32数据手册后,PDF排版混乱
如何复现
- 翻译文档为:STM32L471数据手册,经过测试其他STM32的数据手册也有相似的问题,如STM32F103等
- 翻译服务使用bing,英文翻译为简体中文
- 翻译得到的文档的目录部分出现严重的排版混乱
预期行为
目录部分照原样排版
相关 Logs
原始PDF文件
还有别的吗?
对于这些由其他应用程序而非扫描创建的PDF文件,是否可以考虑增加一个不使用OCR扫描而是直接使用PDF本身排版信息的模式?类似于下图这样,用Adobe Acrobat或类似PDF编辑软件其实可以直接打开并编辑各个部分的文字,即PDF文档本身就已经包含了文本信息和布局关系,只需要直接读取文本,翻译并放回原位即可

Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
bugSomething isn't workingSomething isn't working