GitHub监控消息提醒!!!
更新了:红队
描述:本仓库聚焦于大模型后训练(Post-Training),内容包括但不限于: 核心方法:SFT、RLHF、RL、DPO、RAG 其他方向:模型蒸馏、对齐方法、红队测试、安全性调优等 目标:记录和沉淀相关知识、方法与实践经验,旨在从原型 Demo 推动到实际落地应用。
URL:https://github.com/study8677/post-training
标签:#红队
更新了:红队
描述:本仓库聚焦于大模型后训练(Post-Training),内容包括但不限于: 核心方法:SFT、RLHF、RL、DPO、RAG 其他方向:模型蒸馏、对齐方法、红队测试、安全性调优等 目标:记录和沉淀相关知识、方法与实践经验,旨在从原型 Demo 推动到实际落地应用。
URL:https://github.com/study8677/post-training
标签:#红队