# 概述
海智 LLM 平台的模型微调功能是一个集成的 LLM 模型训练和管理系统,提供从数据准备、模型训练、模型测试到模型部署的完整工作流程。
切换到 海聪公共空间(仅查看)工作空间,可查看样例数据/训练/模型。
# 核心优势
# 开箱即用的训练能力 📖
- 预设环境:平台预设训练环境、资源配比、日志采集、指标采集和监控采集,用户无需关心底层配置
- 多模型支持:提供多种开源大模型和开源框架的训练配置,满足不同场景需求
- 高级功能:支持增量训练、多机多卡训练、训练框架指定、自定义参数等高级功能
- 实时监控:提供任务日志、训练指标(loss、accuracy)和资源监控(GPU、内存)的实时查看
# 全面的评测体系 📖
- 多维度评测:支持行业基准测试和自定义数据集测试,评测模版可复用
- 丰富指标:提供 auc、bleu、rouge 等多种评测指标,支持数据集级别和子集级别的指标对比
- 多模型来源:支持选择训练任务产出、我的模型或开源模型进行评测,支持多机多卡推理配置
- 可视化结果:评测概览、指标对比和预测结果的可视化展示,直观了解模型效果
- 日志追踪:当任务运行失败时,可查看详细日志定位问题,快速调整配置
# 便捷的模型部署 📖
- 快速测试:提供临时快速部署功能,无需复杂配置即可验证模型效果
- 多样化验证:支持对话页面交互和 API 调用两种验证方式,满足不同使用场景
- 灵活配置:支持多机多卡部署和推理参数配置,满足不同性能需求
- 便捷调试:对话页面提供 prompt 配置和请求参数调整,服务日志实时查看运行状态
# 完善的数据管理 📖
- 多格式支持:支持多种数据格式和文件格式上传,灵活适配不同场景
- 版本控制:提供数据集版本管理,支持版本继承和发布机制,确保训练数据可追溯
- 预置数据集:平台提供丰富的公共数据集,快速开始训练任务
- 灵活导入:支持网页导入和终端导入两种方式,满足不同使用习惯
# 统一的模型管理 📖
- 版本化管理:模型版本固定化存储,确保模型可追溯和可复现
- 多场景复用:模型可用于增量训练、效果评测和快速部署,实现一次训练多次使用
- 灵活导入:支持训练任务产出和外部模型上传两种方式,方便模型迁移