LLM Agent 全链路质量保障体系
专业LLM Agent评估框架,解决基准测试与生产环境脱节问题,通过统计测试、行为契约和对抗测试提升可靠性,适合AI质量工程师和Agent开发者。
CLS 安全 S
源可信度 T2
下载 4.5k 安装 7
0%推荐
v1.0.0
rustyorb
llm-evaluation
agent-testing
benchmark-design
reliability-engineering
behavioral-testing
adversarial-testing
production-monitoring
ml-ops
ai-quality
安装方式
手动下载安装
下载 ZIP 后解压到技能目录即可安装。若在桌面客户端 WebView中直接下载出现异常,本站会改为提示页 + 原始链接,请按页内说明操作。
下载 ZIP (cc-9418-v1.0.0.zip)跨平台安装指引
该技能声明兼容以下 1 个平台,将 ZIP 解压到对应目录即可被识别。
unzip cc-9418-v1.0.0.zip -d ~/.openclaw/skills/
目录不存在时请先
mkdir -p 创建;启用 Skill 后请重启对应 Agent 让配置生效。
使用指南
简介
专业LLM Agent评估框架,解决基准测试与生产环境脱节问题,通过统计测试、行为契约和对抗测试提升可靠性,适合AI质量工程师和Agent开发者。
## 简介
专业LLM Agent评估框架,解决基准测试与生产环境脱节问题,通过统计测试、行为契约和对抗测试提升可靠性,适合AI质量工程师和Agent开发者。