# 模型训练

# 模型精调

使用准备好的数据集对预训练模型进行微调,平台预设训练环境/资源配比/日志采集/指标采集/监控采集,用户仅需关注算法配置层面的调整。

# 任务合集

任务合集列表页面,展示所有的训练任务合集。

# 任务列表

合集内的任务列表页面,展示某个合集下的所有训练任务及其状态。

# 创建任务

平台提供多种开源大模型的训练以及开源框架的训练配置,支持增量训练/多机多卡训练/训练框架指定/自定义参数等功能。

如果需要增加模型或配置,可联系管理员

# 任务详情

任务详情页面,展示训练任务的基本信息、配置参数和执行状态。

  • 任务日志页面,实时查看训练过程中的日志输出。
  • 任务指标页面,自动化采集并可视化展示训练过程中的 loss、accuracy 等关键指标变化。
  • 任务监控页面,展示训练过程中的资源使用情况,如 GPU、内存等。