Skip to content
目录

模型推理计费

概述

按量后付费根据实际接口调用产生的 tokens 或图片数量以及单价进行计费,不同预置服务调用单价不同,大语言模型根据实际的输入及输出总和 tokens 数量,系统每小时会对您的账户进行扣费

自研模型

taichu 系列模型价格参考阿里千问系列同类型竞品

模型分类模型名称Model_Code上下文长度在线推理单价批量推理价格
自然语言处理Taichu-LLMtaichu_llm32K输入:0.0020元/千 tokens4折优惠
输出:0.0060元/千 tokens
Taichu-O1taichu_o132K输入:0.0020元/千 tokens4折优惠
输出:0.0060元/千 tokens
多模态Taichu-ASRtaichu_asr/时间:0.18元/分钟/
Taichu-TTStaichu_tts/输入:0.15元/千字符/
Taichu-VLtaichu_vl4K输入:0.0020元/千 tokens/
输出:0.0050元/千 tokens
Taichu-text2Imagetaichu_text2image/输出:0.14元/张/

开源模型

模型分类模型名称Model_Code上下文长度在线推理单价批量推理价格
自然语言处理DeepSeek–R1deepseek_r164K输入:¥0.004元/千 tokens4折优惠
输出:¥0.016元/千 tokens
DeepSeek–R1–Distill–Qwen–14Bdeepseek_r1_distill_qwen_14b32K输入:¥0.001元/千 tokens4折优惠
输出:¥0.003元/千 tokens
DeepSeek–R1–Distill–Qwen–32Bdeepseek_r1_distill_qwen_32b32K输入:¥0.002元/千 tokens4折优惠
输出:¥0.006元/千 tokens
DeepSeek–R1–Distill–Llama–70Bdeepseek_r1_distill_llama_70b32K输入:¥0.005元/千 tokens4折优惠
输出:¥0.02元/千 tokens
QWQ–32Bqwq_32b32K输入:¥0.002元/千 tokens4折优惠
输出:¥0.006元/千 tokens
Qwen3–1.7Bqwen3_1_7b32K输入:¥0.0003元/千 tokens4折优惠
输出:¥0.0012元/千 tokens(非思考)
输出:¥0.003元/千 tokens(思考)
Qwen3–14Bqwen3_14b128K输入:¥0.0017元/千 tokens4折优惠
输出:¥0.004元/千 tokens(非思考)
输出:¥0.017元/千 tokens(思考)
Qwen3–30B–A3Bqwen3_30b_a3b128K输入:¥0.00075元/千 tokens4折优惠
输出:¥0.003元/千 tokens(非思考)
输出:¥0.0075元/千 tokens(思考)
Qwen3–235B–A22Bqwen3_235b_a22b128K输入:¥0.002元/千 tokens4折优惠
输出:¥0.008元/千 tokens(非思考)
输出:¥0.027元/千 tokens(思考)
多模态qwen2.5–VL–7Bqwen2_5_vl_7b128K输入:¥0.002元/千 tokens/
输出:¥0.005元/千 tokens
qwen2.5–VL–32Bqwen2_5_vl_32b128K输入:¥0.008元/千 tokens/
输出:¥0.024元/千 tokens
计算机视觉RTMDetmmdet_rtmdet/¥0.0008/次/
ViTDetmmdet_vitdet/¥0.0035/次/