测试 #18346: 大模型训练 - H10大模型管理平台开发 - Redmine-产品研发管理系统

测试 #18346

大模型训练

由白金阁在 14 天之前添加. 更新于 12 天之前.

状态:

已关闭

优先级:

普通

指派给:

开始日期:

2025-06-09

计划完成日期:

2025-06-09

% 完成:

0%

预期时间:

#1

由白金阁更新于 14 天之前

状态从新建变更为 进行中

#2

由白金阁更新于 14 天之前

状态从 进行中 变更为 已解决

#3

由白金阁更新于 14 天之前

状态从 已解决 变更为反馈

#4

由白金阁更新于 14 天之前

指派给 从 白金阁 变更为 陈亚峰

现在Qwen2.5-0.5B 增量训练指令微调奖励微调 DPO都跑通了 PPO这个报错超显存
还有glm模型，最小的模型大概15G左右，现在GPU卡不能训练，不能测试其特有的P-tuning

#5

由陈亚峰更新于 14 天之前

状态从反馈变更为 已解决

#6

由陈亚峰更新于 12 天之前

状态从 已解决 变更为 已关闭

导出 Atom PDF