Conversation
cms42
commented
Mar 4, 2026
- llama.cpp inference support for MOSS-TTS-Delay-8B
- ONNX/TRT inference support for MOSS Audio Tokenizer
…version for ONNX & TensorRT inference
|
用Codex Review了一下hh 我看完这个 PR 的主要改动后,先给你结论:有 3 个我认为需要在合并前处理的问题。 [P1] 默认安装路径发生回归:torch/torchaudio/transformers 已从必选依赖移到 optional,但文档仍让用户 pip install -e .;这会让现有主流程脚本在运行时直接因缺包失败(例如 import torch / import transformers)。Refs: /tmp/moss-tts-pr58/pyproject.toml:13, /tmp/moss-tts-pr58/README.md:149, /tmp/moss-tts-pr58/clis/moss_tts_app.py:11 我这次主要做了代码与配置审阅,没有跑端到端权重推理(本地无对应 GGUF/ONNX/TRT 权重环境)。 |
…ntime' for PyTorch dependencies and enhance error handling in the audio backend configuration for the LlamaCppPipeline.
|
收到! [P1] 更新了中英文README,[P2] [P3] 按建议做了修改 之前一直focus在性能和功能正确性,确实没咋留意安装、文档和corner case相关的问题()我让Opus再Review一轮,重点关注这些方面🫡
|