Skip to content

Tkhkrnx/llm-systems-paper-agent

Repository files navigation

LLM Systems Paper Agent

这是一套面向大模型系统论文工作流的 Obsidian Agent 工具集,覆盖论文搜索、PDF 入库、MinerU 转换、中文翻译、正式分析笔记和严格审稿。

当前推荐的主流程是:

paper-search -> paper-ingest -> paper-translate -> paper-analyze -> paper-review

主要 Skills

  1. paper-search:在已有论文笔记、PDF 资产、MinerU Markdown 和每日推荐中查重。
  2. paper-ingest:入库 PDF、MinerU Markdown、图片、assets.mdingest_manifest.json
  3. paper-translate:将英文 MinerU Markdown 翻译成中文学术版 Markdown。
  4. paper-analyze:基于 PDF 和 MinerU 证据生成正式分析笔记。
  5. paper-review:生成面向系统/体系结构风格的严格审稿意见。
  6. conf-papers / start-my-day:批量搜索、推荐和论文资产编排。

最新约定

paper-ingest

  • 顶层 asset 目录、MinerU 子目录、主 Markdown stem 统一优先使用短命名:
    • paper_id / arxiv_id
    • 其次是显式稳定 ID
    • 最后才回退到压缩短 slug
  • 不再允许长标题直接主导 asset 顶层目录名。
  • MinerU 默认直接写入最终 asset_dir/mineru/<short-name>/auto/
  • 不再把 MinerU 完整输出先落到中介目录再整棵搬回。
  • 图片归一化是 ingest 的标准步骤,正文引用图默认统一成 fig01fig02 这类短名。
  • ingest_manifest.json 现在会结构化记录:
    • pdf_download_status
    • pdf_validation
    • mineru_status
    • mineru_md
    • naming_source
    • mineru_recovery
    • mineru_failure_detail
    • image_normalization
    • proxy_mode

paper-translate

  • 只消费已经完成图片归一化的英文 Markdown。
  • 如果仍存在 hash 风格图片名,或者图片引用缺失,会直接失败而不是静默继续。
  • API 请求默认不继承系统代理,显式使用 requests.Session(trust_env=False)
  • 翻译结果会写回:
    • translated_md
    • translation_status
    • translation_updated
    • translation_input_validation
    • translation_proxy_mode

paper-review

  • 正式审稿材料固定为 MinerU 英文原文 Markdown 与同目录图片资产,不再以 PDF 作为默认审稿输入。
  • paper-analyze 笔记可以作为辅助定位材料,但不能替代原文证据,也不会在 review 正文中作为来源出现。
  • review 主体按系统 / 体系结构 / HPC 顶会标准生成中文意见,重点检查:
    • 同预算 baseline 公平性
    • 端到端系统代价
    • deployment realism
    • 外推边界
    • reproducibility
  • 图片引用会在生成前校验;图片可达性、evidence anchors、presentation issues 和 rebuttal sensitivity 放在附录,而不是塞进主体结论。
  • 当前 paper-review 已同步到:
    • C:/Users/peng/.codex/skills/paper-review
    • C:/Users/peng/.claude/skills/paper-review
    • C:/Users/peng/Documents/PHR/obsidian_phr/.claude/skills/paper-review
  • 仓库还提供了 GitHub Copilot repo-level instructions:
    • .github/copilot-instructions.md
    • .github/instructions/paper-review.instructions.md

路径约定

  • 仓库源码:C:/Users/peng/Documents/PHR/Intellistream/projects/llm-systems-paper-agent
  • 默认 Obsidian vault:C:/Users/peng/Documents/PHR/obsidian_phr
  • Codex skills:C:/Users/peng/.codex/skills
  • Claude Code skills:C:/Users/peng/.claude/skills
  • Vault 内 Codex skills:C:/Users/peng/Documents/PHR/obsidian_phr/.codex/skills
  • Vault 内 Claudian skills:C:/Users/peng/Documents/PHR/obsidian_phr/.claude/skills

使用建议

  • 批量找论文时,先用 conf-paperspaper-search 查重。
  • 需要入库时,用 paper-ingest 保存 PDF、MinerU Markdown 和图片资产。
  • 需要中文阅读材料时,用 paper-translate
  • 需要正式研究笔记时,用 paper-analyze
  • 需要严格审稿意见时,用 paper-review

文档边界

README 用来说明整体工作流、skills 关系和当前推荐约定。

更细的规则以各 skill 为准,尤其是:

  • paper-ingest/SKILL.md:PDF 下载、短命名、MinerU 状态、manifest 字段和图片归一化
  • paper-translate/SKILL.md:翻译输入要求、图片校验、代理隔离和 manifest 写回
  • paper-analyze/SKILL.md:教学式长段分析笔记、证据边界和结构化输出要求
  • paper-review/SKILL.md:基于 MinerU Markdown 与图片资产的系统 / 体系结构 / HPC 严格中文审稿要求

Copilot 配置

仓库已经为整个项目配置 GitHub Copilot 的 repo-level instructions,而不只是 paper-review

  • 总入口:.github/copilot-instructions.md
  • 各 skill 局部规则:.github/instructions/*.instructions.md

当前已覆盖:

  • conf-papers
  • extract-paper-images
  • paper-analyze
  • paper-ingest
  • paper-review
  • paper-search
  • paper-translate
  • start-my-day

这些规则的目标是把每个 skill 的职责边界、输入输出约定和质量要求配置进 Copilot,而不是把某一篇论文、某一份笔记或某一次测试产物固化成模板。

About

Personalized Obsidian paper agent for LLM inference systems and state optimization, adapted from juliye2025/evil-read-arxiv

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages