Trans2Former

本地优先的多格式文档转换工具

Trans2Former 是一个专业级的桌面文档转换工具，支持 12 种输入格式和 11 种输出格式的相互转换。所有转换在本地完成，零上传，保护您的数据隐私。

✨ 特性

🔒 本地优先 - 所有转换在本地完成，不上传任何数据
🚀 高性能 - 基于 Web Worker 的并行处理
📦 零依赖 - 不需要安装 Office、LibreOffice 或 Pandoc
🎨 实时预览 - 转换前后实时预览文档
🔤 本地 OCR - 图片 / 扫描 PDF 用内置 PP-OCRv5（ONNX Runtime + WebGPU）本地识别，含方向校正、倾斜纠偏、自适应去噪、版面结构（标题/段落）与质量评分
🧮 LaTeX 渲染 - 预览中用本地 KaTeX 排版 $...$ / $$...$$ 数学公式
✅ 转换后检验 - 规则 diff + SSIM 视觉对比 + OCR 回读三层组合统一写入 QualityReport，工作台可视
🌍 多语言 - 支持中英文、RTL 文本等
⚡ 无大小限制 - 不设置人为文件大小上限

📋 支持的格式

输入格式（12 种）

文档: Markdown, HTML, TXT, DOCX, PDF, EPUB
数据: JSON, CSV, XML, XLSX
演示: PPTX
图片: PNG

输出格式（11 种）

文档: Markdown, HTML, TXT, DOCX, PDF, EPUB
数据: JSON, CSV, XML, XLSX
演示: PPTX

🚀 快速开始

安装依赖

npm install

启动应用

npm start

然后在浏览器中打开：

http://localhost:3000

运行测试

npm test

生成 Release 包

npm run release:prepare

🏗️ 项目结构

Trans2Former/
├── public/                    # 前端界面
│   ├── app.js                 # 主应用逻辑
│   ├── core/                  # 核心模块
│   │   ├── models/            # 数据模型
│   │   ├── format-registry.js # 格式注册表
│   │   └── workbench-state.js # 工作台状态
│   ├── formats/               # 格式处理器
│   │   ├── markdown.js        # Markdown 处理
│   │   ├── html.js            # HTML 处理
│   │   ├── docx.js            # DOCX 处理
│   │   ├── pdf.js             # PDF 处理
│   │   └── ...                # 其他格式
│   └── workers/               # Web Workers
├── samples/                   # 样例文件（50+）
├── tests/                     # 测试套件
├── docs/                      # 完整文档
├── src-tauri/                 # Tauri 桌面壳
└── scripts/                   # 构建脚本

📖 使用指南

基本使用

上传文件 - 拖拽或点击上传按钮
选择格式 - 选择目标输出格式
预览 - 查看转换前后的预览
转换 - 点击转换按钮
下载 - 下载转换结果

高级功能

批量转换 - 同时转换多个文件
编辑输出 - 直接编辑转换后的文本
版本历史 - 查看和恢复历史版本
转换检验报告 - 规则 diff / SSIM / OCR 回读 + OCR 识别质量评分

🧩 核心本地增强

Trans2Former 不再提供插件安装模式，增强能力代码直接并入核心本地模块；模型资源不进入 git 仓库，由 vendor 脚本 + 本地下载重建，随应用打包：

本地 OCR（PP-OCRv5） - 图片 / 扫描 PDF 经 ONNX Runtime + WebGPU（WASM 回退）在本机识别；含 cls 方向校正（180°，可选模型）、任意角倾斜自动纠偏、自适应中值去噪、版面结构识别（按字号/间距归并标题+段落）、识别质量评分（grade / 置信度 / 低置信行 / 纠偏 / 去噪），全程零联网、零上传
轻量 OCR（Tesseract.js） - 可选的轻量 OCR 引擎，按需在安全中心导入 tessdata
转换后检验三层 - 规则 diff + SSIM 视觉对比 + OCR 回读统一写入 QualityReport，工作台「转换检验报告」可视
LaTeX 数学渲染 - 本地 KaTeX，零联网
OFD 支持 / 版面分析 / 表格恢复 - 核心内置，持续攻坚
高级 OCR（远期） - PaddleOCR-VL / MinerU 等 VLM 受浏览器/Tauri 本地运行时限制，作为远期/外部资源评估（详见 docs）

运行高级 OCR：npm install onnxruntime-web && npm run vendor:onnx。PP-OCRv5 mobile 检测/识别模型与字典由 npm run vendor:paddle 从钉定来源下载、SHA-256 校验（见 scripts/paddleocr-models.manifest.json）并随 release:prepare 打包，启动自动载入、开箱即用；方向分类（cls）为可选，可在安全中心导入/替换。详见 docs/PP_OCRV5_BROWSER_VERIFICATION.md。

这些能力不通过插件包分发；实现继续保持本地执行、无上传、可解释降级和资源预算约束。

🛡️ 数据安全

Trans2Former 严格遵守本地优先原则：

✅ 所有转换在本地完成
✅ 不上传文件、文件名或内容
✅ 不上传转换结果或错误日志
✅ 文档处理阶段禁止联网
✅ 不接入第三方 API 或分析 SDK

🧪 测试

项目包含完整的测试套件：

npm test

测试覆盖（28 个脚本全量通过）：

✅ 核心转换 / 快照 / 格式能力审计
✅ 转换检验三层（规则 diff / SSIM / OCR 回读）
✅ OCR 管线（预处理 / DB 后处理 / CTC 解码 / 方向 / 倾斜 / 去噪 / 结构）+ 真实模型集成（onnxruntime-node，缺依赖优雅跳过）
✅ LaTeX 数学 tokenization
✅ 安全 / 资源预算 / 方向门禁 / 发布就绪

复杂/大体积样例语料：npm run samples:generate 程序化产出覆盖全格式、大小不一（large ≥ 3MB）的测试样例到 samples/generated/（gitignore）。

📚 文档

核心文档

开发任务 - 当前任务和进度
更新日志 - 版本更新记录
贡献指南 - 如何贡献代码
安装指南 - 详细安装说明

架构文档

多模型架构 - 核心架构设计
转换路由 - 转换路径规划
桌面应用架构 - 桌面应用设计
安全策略 - 本地优先和无插件处理边界

产品文档

产品策略 - 产品定位和原则
格式路线 - 格式支持计划
基础格式质量 - 质量标准

🎯 技术架构

核心技术栈

前端: HTML, CSS, JavaScript
桌面: Tauri v2
转换: TypeScript + Web Workers
格式: 自研解析器 + 标准库

数据模型

SemanticDoc - 语义文档模型
WorkbookModel - 工作簿模型
SlideModel - 幻灯片模型
FixedLayoutModel - 固定布局模型
AssetGraph - 资源图模型

转换流程

输入文件 → Reader → DocumentModel → Mapper → Writer → 输出文件

🚧 已知限制

复杂样式 - 部分复杂样式可能无法完全保留
图表动画 - PPTX 动画和图表需要后续核心增强
OCR 难例 - 强斜体 / 复杂艺术字识别仍受限（常规、倾斜、倒置、带噪文档已支持）；真实 ONNX 推理在浏览器 / Tauri（WebGPU/WASM）执行
ZIP64 - 暂不支持超大 ZIP 文件

这些限制将在后续版本中通过核心本地模块逐步解决。

🗺️ 路线图

已完成 ✅

P0-P8 核心功能 + 12 种输入 / 11 种输出格式
转换后检验三层（规则 diff + SSIM + OCR 回读）+ 工作台可视
本地 OCR（PP-OCRv5：识别 + 方向校正 + 倾斜纠偏 + 去噪 + 版面结构 + 质量评分）
LaTeX 数学渲染（KaTeX）
Windows 桌面发布（MSI / NSIS）

进行中 🚧

跨平台安装包（macOS / Linux）+ 签名公证
OCR 表格结构识别 → Markdown 表格

计划中 📋

强斜体 / 艺术字识别增强
高级 OCR（PaddleOCR-VL / MinerU）本地运行时评估
更多格式支持

🤝 贡献

欢迎贡献代码、报告问题或提出建议！

Fork 本仓库
创建特性分支 (git checkout -b feature/AmazingFeature)
提交更改 (git commit -m 'Add some AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
开启 Pull Request

详见 CONTRIBUTING.md。

📄 许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件。

🔗 链接

仓库: https://github.com/Vantalens/Trans2Former
社区: https://linux.do/
文档: docs/README.md

💬 反馈

如有问题或建议，欢迎：

提交 Issue
参与 Discussions
访问我们的社区

Made with ❤️ by Trans2Former Team

Name		Name	Last commit message	Last commit date
Latest commit History 99 Commits
.claude		.claude
docs		docs
public		public
samples		samples
scripts		scripts
src-tauri		src-tauri
src		src
tests/snapshots/conversions		tests/snapshots/conversions
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
COMMIT_CHECKLIST.md		COMMIT_CHECKLIST.md
CONTRIBUTING.md		CONTRIBUTING.md
DEVELOPMENT_TASKS.md		DEVELOPMENT_TASKS.md
INSTALL.md		INSTALL.md
LICENSE		LICENSE
README.md		README.md
RELEASE_GUIDE.md		RELEASE_GUIDE.md
RELEASE_NOTES_v2.0.0.md		RELEASE_NOTES_v2.0.0.md
RELEASE_NOTES_v2.1.0.md		RELEASE_NOTES_v2.1.0.md
RELEASE_NOTES_v2.3.0.md		RELEASE_NOTES_v2.3.0.md
package-lock.json		package-lock.json
package.json		package.json

Folders and files

Latest commit

History

Repository files navigation