6. trl 库

介绍 trl 库的基本原理及其在强化学习微调中的代码实现方法

参考资料
- 库：TRL - Transformer Reinforcement Learning

Previous5. peft 库 Next7. verl 库

Last updated 46 minutes ago

Was this helpful?