3. LLM Evaluation

介绍大规模语言模型(LLM)的评估方法与实践经验

什么是 LLM 评估

LLM 评估的基础知识

现有基准 Benchmarks

创建新的评估基准

评估的主要挑战

评估中易被忽视的要点

越狱攻击

Last updated

Was this helpful?