一个现代化的 LLM Prompt 批量测试工具,支持多家 API 提供商,具备 Terminal CLI 风格界面。
- 🚀 多 Provider 支持 - OpenRouter、Vertex AI、Wangsu Gemini、Cloudsway、阿里百炼、火山引擎、AiOnly、AiIIOnly
- 📊 批量测试 - 并发控制、间隔设置、实时流式输出
- 🧠 Thinking 支持 - 火山 / 阿里 / Vertex 原生支持,AiOnly / AiIIOnly 按兼容协议自动尝试
- 🎯 详细元数据 - Token 统计、首字延迟、费用估算、生成速度
- 📝 多种预览模式 - Raw 原始输出 / Markdown 渲染 / HTML 页面预览
- 🔐 本地存储 - API Key 安全存储在浏览器本地
- 🌙 Terminal 风格 - 酷炫的终端 CLI 主题设计
- 框架: React 18 + Vite 7
- 样式: TailwindCSS + shadcn/ui 组件
- 渲染: marked.js + highlight.js + mermaid.js
访问: https://sn1p4am.github.io/prompty/
# 安装依赖
npm install
# 启动开发服务器
npm run dev -- --host
# 构建生产版本
npm run build- 配置访问凭证 - 点击设置图标,添加 API Key
- 选择模型 - 从下拉菜单选择要测试的模型
- 输入 Prompt - 在输入框中编写你的提示词
- 调整参数 - 设置 Temperature、Top-P、Max Tokens 等
- 开始测试 - 点击运行按钮,观察实时流式输出
Prompty 中的 Vertex AI 渠道现在只保留 Vertex Express Mode:
- 使用
API key - 请求路径:
/v1/publishers/google/models/{MODEL_ID}:generateContent - 不需要
Project ID - 不需要
Location
模型示例:
gemini-2.5-flashgemini-2.5-progemini-2.5-flash-lite
切换到 Vertex AI 渠道后,左侧会出现专属扩展面板,当前保留文本生成场景真正需要的原生参数:
thinkingLevelthinkingBudgetresponseMimeTyperesponseSchema
注意:
- 顶部通用
Thinking开关关闭时,会向原生接口发送thinkingBudget: 0 responseSchema只有在responseMimeType不是text/plain时才有效application/json可以不带 schema;text/x.enum建议搭配 schema 使用
Wangsu Gemini 渠道使用网宿 AI Gateway 的 Google Gemini 直连模式:
- 网关 ID:
ytagcuik - Base URL:
https://aigateway.edgecloudapp.com/v2/gws/ytagcuik/gemini/v1beta - 文本模型:
gemini.gemini-3-flash-preview、gemini.gemini-3.5-flash、gemini.gemini-3.1-pro-preview - 鉴权:在页面中保存 AI Gateway Token,请求通过
x-goog-api-key发送 - 普通文本测试支持流式与非流式,缓存命中测试也可选择
generateContent或streamGenerateContent
注意:该网关当前只开放 models/{model}:generateContent 与 models/{model}:streamGenerateContent 形态,缓存命中测试按隐式缓存读取 usageMetadata.cachedContentTokenCount。
Gemini 缓存检测实现和排查可参考:Gemini 缓存命中检测方案。
Wangsu Anthropic 渠道使用网宿 AI Gateway 的 Anthropic 直连模式:
- 网关 ID:
3s9bal7f - Base URL:
https://aigateway.edgecloudapp.com/v2/gws/3s9bal7f/anthropic/v1 - 模型:
anthropic.claude-opus-4-8、anthropic.claude-sonnet-4-6 - 鉴权:与 Wangsu Gemini 共用页面中的 AI Gateway Token,请求通过
X-Api-Key发送 - 普通文本测试使用 Anthropic 原生
/v1/messages协议,缓存命中测试读取cache_read_input_tokens与cache_creation_input_tokens
排查缓存命中问题可参考:Wangsu Anthropic 缓存命中检测方案。
MODEL_ID="gemini-3-pro-preview"
API_KEY="YOUR_API_KEY"
curl \
-X POST \
-H "Content-Type: application/json" \
"https://aiplatform.googleapis.com/v1/publishers/google/models/${MODEL_ID}:streamGenerateContent?key=${API_KEY}" -d \
$'{
"contents": {
"role": "user",
"parts": [
{
"text": "Describe this picture."
}
]
}
}'MIT License