正在前往 HELM

HELM是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。

https://crfm.stanford.edu/helm/latest/?utm_source=ai-bot.cn

如果没有自动跳转，请点击这里