LLM Agent 全链路质量保障体系

专业LLM Agent评估框架，解决基准测试与生产环境脱节问题，通过统计测试、行为契约和对抗测试提升可靠性，适合AI质量工程师和Agent开发者。

CLS 安全 S 源可信度 T2 下载 4.5k 安装 7 0%推荐

v1.0.0 rustyorb

llm-evaluation agent-testing benchmark-design reliability-engineering behavioral-testing adversarial-testing production-monitoring ml-ops ai-quality

安装方式

claw install cc-9418

需要安装 CLAW CLI

下载 ZIP 后解压到技能目录即可安装。若在桌面客户端 WebView中直接下载出现异常，本站会改为提示页 + 原始链接，请按页内说明操作。

该技能声明兼容以下 1 个平台，将 ZIP 解压到对应目录即可被识别。

OpenClaw（开爪） OpenClaw

macOS / Linux：~/.openclaw/skills/

Windows：%USERPROFILE%\.openclaw\skills\

unzip cc-9418-v1.0.0.zip -d ~/.openclaw/skills/

目录不存在时请先 mkdir -p 创建；启用 Skill 后请重启对应 Agent 让配置生效。

专业LLM Agent评估框架，解决基准测试与生产环境脱节问题，通过统计测试、行为契约和对抗测试提升可靠性，适合AI质量工程师和Agent开发者。

## 简介

专业LLM Agent评估框架，解决基准测试与生产环境脱节问题，通过统计测试、行为契约和对抗测试提升可靠性，适合AI质量工程师和Agent开发者。