Skip to content

翻译STM32数据手册后,PDF排版混乱 #1078

@1530974299

Description

@1530974299

在提问之前...

  • 我已经尝试了PDFMathTranslate-next,并在PDFMathTranslate-next提交了issue
  • 我已经搜索了现有的 issues
  • 我在提问题之前至少花费了 5 分钟来思考和准备
  • 我已经认真且完整的阅读了 wiki
  • 我已经认真检查了问题和网络环境无关(包括但不限于Google不可用,模型下载失败)

使用的环境

- **OS**: Microsoft Windows 10 家庭版 22H2 (内部版本19045.6466)
- **pdf2zh**: v1.9.11

请选择安装方式

exe

描述你的问题

翻译STM32数据手册后,PDF排版混乱

如何复现

  1. 翻译文档为:STM32L471数据手册,经过测试其他STM32的数据手册也有相似的问题,如STM32F103等
  2. 翻译服务使用bing,英文翻译为简体中文
  3. 翻译得到的文档的目录部分出现严重的排版混乱

预期行为

目录部分照原样排版

相关 Logs


原始PDF文件

stm32l471rg-P001-016.pdf

还有别的吗?

对于这些由其他应用程序而非扫描创建的PDF文件,是否可以考虑增加一个不使用OCR扫描而是直接使用PDF本身排版信息的模式?类似于下图这样,用Adobe Acrobat或类似PDF编辑软件其实可以直接打开并编辑各个部分的文字,即PDF文档本身就已经包含了文本信息和布局关系,只需要直接读取文本,翻译并放回原位即可

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions