项目

一般

简介

测试 #18346

大模型训练

白金阁14 天 之前添加. 更新于 12 天 之前.

状态:
已关闭
优先级:
普通
指派给:
开始日期:
2025-06-09
计划完成日期:
2025-06-09
% 完成:

0%

预期时间:
#1

白金阁 更新于 14 天 之前

  • 状态新建 变更为 进行中
#2

白金阁 更新于 14 天 之前

  • 状态进行中 变更为 已解决
#3

白金阁 更新于 14 天 之前

  • 状态已解决 变更为 反馈
#4

白金阁 更新于 14 天 之前

  • 指派给白金阁 变更为 陈亚峰

现在Qwen2.5-0.5B 增量训练 指令微调 奖励微调 DPO都跑通了 PPO这个报错超显存
还有glm模型,最小的模型大概15G左右,现在GPU卡不能训练,不能测试其特有的P-tuning

#5

陈亚峰 更新于 14 天 之前

  • 状态反馈 变更为 已解决
#6

陈亚峰 更新于 12 天 之前

  • 状态已解决 变更为 已关闭

导出 Atom PDF