# 概述

海智 LLM 平台的模型微调功能是一个集成的 LLM 模型训练和管理系统,提供从数据准备、模型训练、模型测试到模型部署的完整工作流程。

切换到 海聪公共空间(仅查看)工作空间,可查看样例数据/训练/模型。

# 核心优势

# 开箱即用的训练能力 📖

  • 预设环境:平台预设训练环境、资源配比、日志采集、指标采集和监控采集,用户无需关心底层配置
  • 多模型支持:提供多种开源大模型和开源框架的训练配置,满足不同场景需求
  • 高级功能:支持增量训练、多机多卡训练、训练框架指定、自定义参数等高级功能
  • 实时监控:提供任务日志、训练指标(loss、accuracy)和资源监控(GPU、内存)的实时查看

# 全面的评测体系 📖

  • 多维度评测:支持行业基准测试和自定义数据集测试,评测模版可复用
  • 丰富指标:提供 auc、bleu、rouge 等多种评测指标,支持数据集级别和子集级别的指标对比
  • 多模型来源:支持选择训练任务产出、我的模型或开源模型进行评测,支持多机多卡推理配置
  • 可视化结果:评测概览、指标对比和预测结果的可视化展示,直观了解模型效果
  • 日志追踪:当任务运行失败时,可查看详细日志定位问题,快速调整配置

# 便捷的模型部署 📖

  • 快速测试:提供临时快速部署功能,无需复杂配置即可验证模型效果
  • 多样化验证:支持对话页面交互和 API 调用两种验证方式,满足不同使用场景
  • 灵活配置:支持多机多卡部署和推理参数配置,满足不同性能需求
  • 便捷调试:对话页面提供 prompt 配置和请求参数调整,服务日志实时查看运行状态

# 完善的数据管理 📖

  • 多格式支持:支持多种数据格式和文件格式上传,灵活适配不同场景
  • 版本控制:提供数据集版本管理,支持版本继承和发布机制,确保训练数据可追溯
  • 预置数据集:平台提供丰富的公共数据集,快速开始训练任务
  • 灵活导入:支持网页导入和终端导入两种方式,满足不同使用习惯

# 统一的模型管理 📖

  • 版本化管理:模型版本固定化存储,确保模型可追溯和可复现
  • 多场景复用:模型可用于增量训练、效果评测和快速部署,实现一次训练多次使用
  • 灵活导入:支持训练任务产出和外部模型上传两种方式,方便模型迁移

# 功能导航