Skip to content
目录

评测集管理

平台提供了灵活多样的数据接入方式和强大的管理功能,以适应你不同的评测需求。

一、创建评测集

本章节旨在引导你完成评测集的创建过程。你可以通过本地上传来创建你的专属评测集。

在“评测集管理”页面,点击【新建评测集】按钮,本地上传结构化的评测数据文件。

操作步骤:

  1. 选择创建方式:点击新建评测集窗口中。
  2. 上传文件
    • 点击上传区域,或直接将文件拖拽至此。
    • 数据要求:为确保上传成功,请严格遵守以下格式要求。
      • 支持文件格式csvxlsx
      • 文件大小限制:文件最大 20MB
      • 数据量限制:数据不超过 5000 条。
      • 文件数量:每次仅支持导入 1 个文件。
      • 数据结构:数据表的表头必须与模板一致,前两列为 input 和 reference_output,其余列将按原文直接导入。
  3. 预览与确认
    • 文件上传后,你可以在界面预览文件内容。如果上传错误,可以点击文件旁的【删除】图标后重新上传。
  4. 开始导入
    • 点击【确定】后,系统开始执行导入任务,页面返回至评测集列表。
    • 在评测集列表中,你会看到一条新的评测集记录。
  5. 查看结果
    • 导入任务完成后,评测集列表中的状态更新为 “成功”
    • 上传失败:状态更新为 “上传失败”。你可以根据失败提示调整文件后,删除该条记录并重新上传。

评测集创建

评测集上传文件

二、管理评测集

创建评测集后,你可以在评测集管理模块进行统一的查看、编辑和版本控制。通过清晰的版本管理,你可以轻松追溯数据变更,确保不同评测实验之间的数据一致性和可比性。

1. 评测集列表

评测集列表页面是你管理所有评测集的入口,集中展示了你创建的所有数据集。

(1) 列表信息解读

列表中每一行代表一个评测集,包含以下关键信息:

  • 名称: 你为评测集设定的唯一名称。
  • 最新版本: 该评测集已发布的最新版本号。
  • 数据量: 最新版本所包含的数据条数。
  • 更新时间: 该评测集最近一次被修改的时间。
(2) 功能与操作
  • 搜索: 在页面顶部的搜索框中输入评测集名称的关键词,可以快速筛选和定位目标数据集。
  • 新建评测集: 点击此按钮,返回本手册第一部分“创建评测集”的流程。
(3) 单个评测集操作

在列表的操作列中,你可以对单个评测集执行以下操作:

  • 查看: 点击后进入该评测集的详情页面,你可以在此查看、编辑和管理数据及版本。
  • 删除: 点击后,系统会弹出确认对话框。确认后,该评测集及其所有版本和数据将被永久删除,请谨慎操作。

评测集列表

2. 评测集详情与版本管理

在评测集详情页面,你可以对单个数据集进行深入的管理。页面左侧为版本管理面板,右侧为数据详情展示与编辑区。

(1) 数据编辑与操作

数据详情区的顶部提供了一系列强大的数据管理工具:

  • 编辑列: 点击后可以管理数据集的表头结构。你可以修改列名,或定义/修改每一列的数据类型(如文本、数字等)。
  • 批量选择: 通过勾选数据行前的复选框,可以一次性选中多条数据,以进行批量操作(如批量删除)。
  • 导入数据: 用于向“当前草稿”版本中添加新数据。点击后提供以下选项:
    • 单条新增: 手动填写表单,一次添加一条数据记录。
    • 批量导入: 从本地上传文件(如 .xlsx.csv)来一次性导入多条数据。注意:单次上传文件大小上限为 20MB。
  • 发布: 当你在“当前草稿”中完成数据编辑后,点击此按钮可将当前草稿发布为一个新的版本。

在数据列表中,你也可以对单条数据进行 编辑查看删除 操作。

评测集数据编辑

(2) 版本管理

版本管理是评测集功能的核心之一。所有的数据新增、编辑、删除操作都在“当前草稿”中进行。当你完成一轮编辑后,可以通过“发布”功能,将当前的数据状态保存为一个新的、不可修改的“历史版本”。

  • 版本列表 (页面左侧)
    • 当前草稿: 你当前正在编辑的活跃版本,所有修改在此发生。
    • 历史版本: 已发布的只读版本快照。每个版本会展示其版本名称提交时间版本说明。你可以点击切换查看不同版本的数据。
  • 发布新版本
    1. 在“当前草稿”中完成所有数据修改。
    2. 点击页面右上角的 【发布】 按钮。
    3. 在弹窗中,为新版本设定一个版本号并填写版本描述(例如“新增了150条关于天气查询的样本”)。
    4. 点击“确认”后,“当前草稿”的数据将被固化为一个新的历史版本。

评测集版本管理