介绍 trl 库的基本原理及其在强化学习微调中的代码实现方法
参考资料
库:TRL - Transformer Reinforcement Learningarrow-up-right
Last updated 46 minutes ago
Was this helpful?