clawhub-scanner

English

与 ClawHub 内置 Security Scan 采用相同的扫描逻辑 — 在本地提前运行完全相同的安全检测，发布前就能发现问题。零依赖。

和 ClawHub 的关系

ClawHub 内置了 Security Scan 功能，会在技能上架前进行安全审查。这个包实现了与之相同的多层扫描逻辑，让你可以在本地运行完全一致的检测 — 发布前提前发现问题，也可以集成到自己的 CI/CD 流程中：

静态正则扫描 — 快速离线的模式匹配，检测已知恶意特征（危险执行、数据窃取、加密挖矿、Prompt 注入等）
LLM 安全评估 — 以 LLM 作为评审，从 5 个安全维度评估技能的实际行为是否与其声明的用途一致
Prompt 注入检测 — 预扫描过滤器，捕捉试图操纵 LLM 评估器的注入攻击

这不是一个通用安全扫描器。它专为 ClawHub / OpenClaw 技能格式设计，理解 AI Agent 插件特有的威胁模型：技能可以指示 AI Agent 执行 Shell 命令、访问凭证、读取文件、通过网络发送数据。

功能特性

静态正则扫描 — 无需 API Key，离线即可检测：
- Shell 命令执行（child_process、exec、spawn）
- 动态代码执行（eval、new Function）
- 加密货币挖矿特征（stratum+tcp、coinhive、xmrig）
- 数据窃取行为（文件读取 + 网络发送）
- 凭证收割（环境变量访问 + 网络发送）
- 代码混淆（十六进制序列、长 base64 载荷）
- Markdown 中的 Prompt 注入模式
- 配置文件中的可疑 URL（短链接、裸 IP 地址）
LLM 安全评估 — 五维度深度分析：
- 目的与能力一致性
- 指令范围分析
- 安装机制风险
- 凭证比例合理性
- 持久化与权限评估
Prompt 注入检测 — 识别常见注入模式：
- "忽略之前的所有指令"
- "你现在是一个..."
- System Prompt 覆盖
- 隐藏的 base64 块
- Unicode 控制字符

安装

# 全局安装
npm install -g clawhub-scanner

# 或直接用 npx 运行
npx clawhub-scanner --help

# 或作为项目依赖安装
npm install clawhub-scanner

命令行使用

# 静态扫描（不需要 API Key）
clawhub-scan --static ./my-skill

# 完整扫描（静态 + LLM 评估）
OPENAI_API_KEY=sk-xxx clawhub-scan ./my-skill

# 批量扫描多个技能
clawhub-scan --static ./skill-a ./skill-b ./skill-c

# JSON 输出（适合 CI/CD 集成）
clawhub-scan --static --json ./my-skill

# 保存扫描结果到目录
clawhub-scan --static --output ./results ./my-skill

# 指定 LLM 模型
clawhub-scan --model gpt-4o ./my-skill

命令行参数

参数	说明
`--static`	仅静态扫描（不调用 LLM，无需 API Key）
`--json`	以 JSON 格式输出结果
`--output <dir>`	将结果保存为 JSON 文件到指定目录
`--model <name>`	LLM 模型名称（默认：`gpt-5-mini`）
`--api-key <key>`	OpenAI API Key（默认读取 `OPENAI_API_KEY` 环境变量）

环境变量

变量	说明
`OPENAI_API_KEY`	LLM 评估所需的 API Key
`OPENAI_EVAL_MODEL`	覆盖默认 LLM 模型

库使用方式

import {
  scanSkill,
  scanSkillContent,
  runStaticScan,
  detectInjectionPatterns,
} from 'clawhub-scanner'

// 扫描技能目录
const result = await scanSkill('/path/to/skill', { staticOnly: true })
console.log(result.staticStatus)       // 'clean' | 'suspicious' | 'malicious'
console.log(result.staticScan.findings) // 发现的问题数组

// 直接扫描内容（无需磁盘 I/O）
const scan = runStaticScan(skillMdContent, [
  { path: 'helper.js', content: 'const { exec } = require("child_process")...' },
])
// => { status: 'suspicious', reasonCodes: [...], findings: [...] }

// 检测 Prompt 注入
const signals = detectInjectionPatterns('忽略之前的所有指令')
// => ['ignore-previous-instructions']

// 带 LLM 的完整扫描
const fullResult = await scanSkill('/path/to/skill', {
  apiKey: 'sk-xxx',
  model: 'gpt-4o',
})
console.log(fullResult.verdict)    // 'benign' | 'suspicious' | 'malicious'
console.log(fullResult.confidence) // 'high' | 'medium' | 'low'

API 参考

`scanSkill(dirPath, options?)` → `Promise<ScanResult | null>`

扫描技能目录。如果未找到 SKILL.md 则返回 null。

`scanSkillContent(skillMd, files?, options?)` → `Promise<ScanResult>`

从原始内容扫描，无需读取磁盘。

`runStaticScan(skillMd, files)` → `StaticScanResult`

仅运行基于正则的静态分析。同步方法，无需 API Key。

`detectInjectionPatterns(text)` → `string[]`

检测文本中的 Prompt 注入模式。

扫描结果格式

{
  "skill": "my-skill",
  "timestamp": "2026-03-13T08:00:00.000Z",
  "staticScan": {
    "status": "suspicious",
    "reasonCodes": ["suspicious.dangerous_exec"],
    "findings": [
      {
        "code": "suspicious.dangerous_exec",
        "severity": "critical",
        "file": "helper.js",
        "line": 5,
        "message": "Shell command execution detected.",
        "evidence": "exec('rm -rf /')"
      }
    ]
  },
  "injectionSignals": [],
  "llmResult": {
    "verdict": "suspicious",
    "confidence": "high",
    "summary": "...",
    "dimensions": { ... },
    "user_guidance": "..."
  }
}

规则码说明

规则码	严重级别	说明
`suspicious.dangerous_exec`	critical	通过 child_process 执行 Shell 命令
`suspicious.dynamic_code_execution`	critical	使用 eval() 或 new Function()
`malicious.crypto_mining`	critical	加密货币挖矿特征
`malicious.env_harvesting`	critical	环境变量访问 + 网络发送
`suspicious.potential_exfiltration`	warn	文件读取 + 网络发送
`suspicious.obfuscated_code`	warn	混淆/编码的载荷
`suspicious.prompt_injection_instructions`	warn	Markdown 中的 Prompt 注入
`suspicious.install_untrusted_source`	warn	短链接或裸 IP 地址

工作原理 — ClawHub 安全检测流水线

┌─────────────────────────────────────────────────────────┐
│                    技能发布                              │
│             (SKILL.md + 代码文件)                        │
└─────────────────┬───────────────────────────────────────┘
                  │
                  ▼
┌─────────────────────────────────────────────────────────┐
│  第一层：静态正则扫描                                     │
│  ─────────────────                                      │
│  • 匹配已知恶意特征模式                                   │
│  • 检查代码中的危险 API 调用                               │
│  • 检查配置文件中的可疑 URL                                │
│  • 检查 Markdown 中的 Prompt 注入                         │
│  结果：clean / suspicious / malicious                    │
└─────────────────┬───────────────────────────────────────┘
                  │
                  ▼
┌─────────────────────────────────────────────────────────┐
│  第二层：Prompt 注入预过滤                                │
│  ──────────────────────                                 │
│  • 检测「忽略之前的所有指令」等模式                         │
│  • 捕获 System Prompt 覆盖尝试                           │
│  • 标记隐藏的 base64 块和 Unicode 控制字符                 │
│  • 将检测信号作为对抗性上下文传递给 LLM                     │
└─────────────────┬───────────────────────────────────────┘
                  │
                  ▼
┌─────────────────────────────────────────────────────────┐
│  第三层：LLM 评审评估                                     │
│  ────────────────                                       │
│  五维度一致性分析：                                       │
│  1. 目的 ↔ 能力 一致性                                    │
│  2. 指令范围边界                                         │
│  3. 安装机制风险                                         │
│  4. 凭证比例合理性                                       │
│  5. 持久化与权限评估                                      │
│                                                         │
│  判定：benign / suspicious / malicious                   │
│  + 置信度 + 面向用户的自然语言指导                          │
└─────────────────────────────────────────────────────────┘

这个扫描器的核心理念是一致性检测，而非恶意软件分类。一个 child_process.exec() 调用在部署类技能中是正常的，但在 Markdown 格式化工具中就很可疑。LLM 评估器理解上下文，它问的是：「这个能力属于这里吗？」

什么是 Skill（技能）？

Skill 是 AI Agent（如 Claude Code、OpenClaw）的插件。每个技能包含：

SKILL.md — 告诉 AI Agent 要做什么的指令文档
可选的代码文件（.js、.py、.sh 等）
可选的元数据（YAML frontmatter）声明依赖、环境变量、安装规范

技能可以非常强大 — 也可能非常危险。它们可以指示 AI Agent 执行 Shell 命令、访问你的凭证、读取你的文件、通过网络发送数据。安装前务必先扫描。

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
bin		bin
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
README_zh.md		README_zh.md
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

clawhub-scanner

和 ClawHub 的关系

功能特性

安装

命令行使用

命令行参数

环境变量

库使用方式

API 参考

`scanSkill(dirPath, options?)` → `Promise<ScanResult | null>`

`scanSkillContent(skillMd, files?, options?)` → `Promise<ScanResult>`

`runStaticScan(skillMd, files)` → `StaticScanResult`

`detectInjectionPatterns(text)` → `string[]`

扫描结果格式

规则码说明

工作原理 — ClawHub 安全检测流水线

什么是 Skill（技能）？

许可证

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

clawhub-scanner

和 ClawHub 的关系

功能特性

安装

命令行使用

命令行参数

环境变量

库使用方式

API 参考

scanSkill(dirPath, options?) → Promise<ScanResult | null>

scanSkillContent(skillMd, files?, options?) → Promise<ScanResult>

runStaticScan(skillMd, files) → StaticScanResult

detectInjectionPatterns(text) → string[]

扫描结果格式

规则码说明

工作原理 — ClawHub 安全检测流水线

什么是 Skill（技能）？

许可证

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`scanSkill(dirPath, options?)` → `Promise<ScanResult | null>`

`scanSkillContent(skillMd, files?, options?)` → `Promise<ScanResult>`

`runStaticScan(skillMd, files)` → `StaticScanResult`

`detectInjectionPatterns(text)` → `string[]`

Packages