Lego-Edit采用强化学习微调的多层学习模型来编排模型级编辑工具,该框架基于两项关键创新:允许灵活组合和精确控制的细粒度工具,以及通过对开放域指令进行无生成式指令反馈来增强推理和工具组织能力的三阶段渐进式强化学习训练策略。 添加微信号:AIGC_Tech,公众号小助手会拉...
没有评论:
发表评论