深色模式
评测集管理
平台提供了灵活多样的数据接入方式和强大的管理功能,以适应你不同的评测需求。
一、创建评测集
本章节旨在引导你完成评测集的创建过程。你可以通过本地上传来创建你的专属评测集。
在“评测集管理”页面,点击【新建评测集】按钮,本地上传结构化的评测数据文件。
操作步骤:
- 选择创建方式:点击新建评测集窗口中。
- 上传文件:
- 点击上传区域,或直接将文件拖拽至此。
- 数据要求:为确保上传成功,请严格遵守以下格式要求。
- 支持文件格式:
csv、xlsx。 - 文件大小限制:文件最大 20MB。
- 数据量限制:数据不超过 5000 条。
- 文件数量:每次仅支持导入 1 个文件。
- 数据结构:数据表的表头必须与模板一致,前两列为 input 和 reference_output,其余列将按原文直接导入。
- 支持文件格式:
- 预览与确认:
- 文件上传后,你可以在界面预览文件内容。如果上传错误,可以点击文件旁的【删除】图标后重新上传。
- 开始导入:
- 点击【确定】后,系统开始执行导入任务,页面返回至评测集列表。
- 在评测集列表中,你会看到一条新的评测集记录。
- 查看结果:
- 导入任务完成后,评测集列表中的状态更新为 “成功”。
- 上传失败:状态更新为 “上传失败”。你可以根据失败提示调整文件后,删除该条记录并重新上传。


二、管理评测集
创建评测集后,你可以在评测集管理模块进行统一的查看、编辑和版本控制。通过清晰的版本管理,你可以轻松追溯数据变更,确保不同评测实验之间的数据一致性和可比性。
1. 评测集列表
评测集列表页面是你管理所有评测集的入口,集中展示了你创建的所有数据集。
(1) 列表信息解读
列表中每一行代表一个评测集,包含以下关键信息:
- 名称: 你为评测集设定的唯一名称。
- 最新版本: 该评测集已发布的最新版本号。
- 数据量: 最新版本所包含的数据条数。
- 更新时间: 该评测集最近一次被修改的时间。
(2) 功能与操作
- 搜索: 在页面顶部的搜索框中输入评测集名称的关键词,可以快速筛选和定位目标数据集。
- 新建评测集: 点击此按钮,返回本手册第一部分“创建评测集”的流程。
(3) 单个评测集操作
在列表的操作列中,你可以对单个评测集执行以下操作:
- 查看: 点击后进入该评测集的详情页面,你可以在此查看、编辑和管理数据及版本。
- 删除: 点击后,系统会弹出确认对话框。确认后,该评测集及其所有版本和数据将被永久删除,请谨慎操作。

2. 评测集详情与版本管理
在评测集详情页面,你可以对单个数据集进行深入的管理。页面左侧为版本管理面板,右侧为数据详情展示与编辑区。
(1) 数据编辑与操作
数据详情区的顶部提供了一系列强大的数据管理工具:
- 编辑列: 点击后可以管理数据集的表头结构。你可以修改列名,或定义/修改每一列的数据类型(如文本、数字等)。
- 批量选择: 通过勾选数据行前的复选框,可以一次性选中多条数据,以进行批量操作(如批量删除)。
- 导入数据: 用于向“当前草稿”版本中添加新数据。点击后提供以下选项:
- 单条新增: 手动填写表单,一次添加一条数据记录。
- 批量导入: 从本地上传文件(如
.xlsx或.csv)来一次性导入多条数据。注意:单次上传文件大小上限为 20MB。
- 发布: 当你在“当前草稿”中完成数据编辑后,点击此按钮可将当前草稿发布为一个新的版本。
在数据列表中,你也可以对单条数据进行 编辑、查看 或 删除 操作。

(2) 版本管理
版本管理是评测集功能的核心之一。所有的数据新增、编辑、删除操作都在“当前草稿”中进行。当你完成一轮编辑后,可以通过“发布”功能,将当前的数据状态保存为一个新的、不可修改的“历史版本”。
- 版本列表 (页面左侧)
- 当前草稿: 你当前正在编辑的活跃版本,所有修改在此发生。
- 历史版本: 已发布的只读版本快照。每个版本会展示其版本名称、提交时间和版本说明。你可以点击切换查看不同版本的数据。
- 发布新版本
- 在“当前草稿”中完成所有数据修改。
- 点击页面右上角的 【发布】 按钮。
- 在弹窗中,为新版本设定一个版本号并填写版本描述(例如“新增了150条关于天气查询的样本”)。
- 点击“确认”后,“当前草稿”的数据将被固化为一个新的历史版本。
