# 模型评测

# 效果评测

效果评测用于对训练任务以及我的模型进行效果评测,展示指标结果以及评测数据结果。

# 评测合集列表

# 新建评测版本

支持行业基准测试以及自定义数据集测试,行业基准使用预置指标,自定义数据集测试支持auc、bleu、rouge指标。

# 评测详情页

评测详情页分为评测记录和版本列表,评测记录为单次进行的模型评测,版本列表为不同的评测模版。

# 新建模型评测

可选择多种模型来源,支持多机多卡推理以及推理参数配置。

# 模型评测结果

支持数据集级别/子集级别的指标对比,以及具体预测结果的查看。

评测概览

评测指标

预测结果

# 模型评测日志

当任务运行失败时,日志功能可以查看失败原因,进而调整配置。