# 模型仓库

用来模型版本管理, 方便后续发布到推理部署

# 新建模型版本

  • 从海聪存储(nas/cpfs)选择导入文件
    创建新版本

注意事项:

  • 导入的模型文件目录将保留原有文件结构,如导入路径为/workspace/nas-data/test,某个模型文件原路径为:/workspace/nas-data/test/lora/model.pt,则导入后为:/lora/model.pt
  • 导入文件夹:最大文件数目前限制在 200
  • 如果文件越大,导入速度可能会越慢,请耐心等待,有疑问可联系管理员

# 管理现有模型版本

  • 支持管理现有模型版本文件,用户更新模型时,免去全量上传的步骤。

列举版本 管理版本

上传网盘文件 上传网盘文件 上传网盘文件

注意事项:

  • 上传网盘文件时需要检查上传的路径是否正确
  • 若新增的文件与旧文件同名,则会直接覆盖

# 分发模型到不同区域/集群

当导入的模型状态为“打包成功”后,如果需要推理部署这个模型,需要点击“分发”按钮,分发到指定区域/集群,如下图所示

模型分发

# 重新分发

重新分发 注意事项:

  • 当更新模型后,需要重新分发模型才会生效

# 推理部署

请查看模型应用章节,部署模型