大模型微调 LLM

看到一个如何训练领域特定模型的文章写得非常好，作者使用 GRPO 微调了 qwen2.5-coder-7B, 实现了一个生成日程表的大模型。并且不光有教程，还有代码，模型。感兴趣的同学可以参考这个学习

教程地址：huggingface.co/blog/anakin87/qwen-scheduler-grpo

代码地址：github.com/anakin87/qwen-scheduler-grpo

模型地址：huggingface.co/anakin87/qwen-scheduler-7b-grpo

作者:spike

分类: 互联网

创作时间:2025-05-26

更新时间:2025-05-27

这篇文章介绍了如何使用GRPO微调qwen2.5-coder-7B模型来生成日程表，包含详细教程、完整代码和训练好的模型，适合想学习大模型微调的人参考。