AI 应用场景探索者 —— 关注 AI 在真实业务中的落地,不只是 Demo。
从 Harness Engineering 到 Spec-Driven Development,
我在找那些能让 AI 从"能用"变成"好用"的关键环节。
相信好的 AI 应用不是调出来的,是设计出来的。
Claude Code 很强,但每次会话结束就"失忆"——不会从经验中学习,下次可能犯同样的错误。这个项目借鉴 Hermes Agent 的设计哲学,用 Claude Code 现有的原语(Hooks、Cron、Memory、Skills)搭建了一个外挂式自我进化闭环:执行任务 → 评估结果 → 提取经验 → 更新策略 → 下次更好。
写了这么多方法论,最终要落到日常使用上。这个仓库是我的 Claude Code 技能工具箱——5 个自用 skill,覆盖三类场景:写作风格(小约翰可汗体、谷雨公众号、博客体)、内容创作工作流、开发工具(临时文件清理、项目模板生成)。每个 skill 一个 SKILL.md,/skill-name 直接调用。
Hermes Agent 会在每条消息中加载所有已安装的 skills,导致 token 浪费。110+ skills 每轮消耗 ~300K tokens。这个工具可以检测重复、估算 token、追踪使用频率、自动清理。
我在 10 小时内烧掉 6000 万 Credits 后,发现了这个问题,于是构建了这个工具。
基于 Fission-AI/OpenSpec 做团队内化定制,增加 agent 适配层、工作流模板和代码审查集成。Spec 是驱动开发的单点可信源——AI 负责执行,人负责判断。
扫描 OpenSpec changes,自动识别可执行的变更,调用 Agent 完成编码。"需求 → Spec → 代码"的闭环真正跑起来。目前以 npm 包形式发布。
AI 写代码很快,但入库率很低。我在自己的 Nest.js 项目里用 OpenSpec + Ralph Loop 把 AI 代码一次性通过率从 30% 提到 75%,记录这套方法论的工程化落地。
用 Next.js 15 + Tailwind CSS 4 + MDX 构建的静态站点,目标用户是来华外国自由行游客。22 个城市/主题页面,部署在 Cloudflare Pages。
| 信念 | 说明 |
|---|---|
| AI 的价值在场景,不在技术 | 再强的模型,找不到合适的应用场景也是白搭 |
| 好的 AI 应用是设计出来的 | Prompt 工程解决单次问题,流程设计解决系统问题 |
| 从"能用"到"好用"隔着一百个细节 | Demo 展示可能性,生产环境考验可靠性 |
如果你也在探索 AI 的真实应用场景,不管是代码生成、内容创作还是别的什么,欢迎来交流。



