6. trl 库

介绍 trl 库的基本原理及其在强化学习微调中的代码实现方法

Last updated

Was this helpful?