Skip to content
目录

模型蒸馏

模型蒸馏的费用包括教师模型构建蒸馏数据集以及学生模型微调训练两个核心环节。其中教师模型构建蒸馏数据采用批量推理的方式,限时优惠价格为在线推理价格的4折。因此模型蒸馏总价为教师模型批量推理价格加上学生模型微调训练价格。

教师模型推理计费

模型蒸馏中构建蒸馏数据过程实际采用批量推理产生推理数据集,因此该部分将按照批量推理的计费标准执行费用结算。具体价格可查看模型服务计费中批量推理的计费标准。

训练学生训练计费

模型蒸馏中训练学生模型过程实际采用了模型微调,因此该部分将按照模型微调的计费标准执行费用结算。具体价格可查看模型调优中微调的计费标准。

价格费用示例

示例1:使用DeepSeek-R1作为教师模型,Qwen3-0.6B作为学生模型;教师模型批量推理输入消耗10000toknes,输出消耗10000toknes,学生模型微调时长1小时

蒸馏总价 = 教师模型批量推理总价 + 学生模型训练时长 = (10000toknes x 0.004元/千 tokens + 10000toknes x 0.016元/千 tokens) x 0.001(千位计算) x 0.4(4折优惠) + 0.11元/分钟 x 60分钟 = 6.68元