控制台登录立即注册

AI 大模型推理服务

AI 大模型推理服务为企业提供高效、稳定、安全的模型推理服务，支持DeepSeek-R1、Qwen2.5等主流开源大模型，并整合了图文识别（OCR）、语音文字识别（ASR）、文字转语音（TTS）、多媒体介质存储（对象存储）和输入输出（RTC快直播）等丰富的音视图文能力，帮助客户、开发者轻松实现服务智能化集成及智能应用开发。

API 文档模型列表价格文档

模型列表

DeepSeek-R1

DeepSeek 团队发布的最新开源模型，具备非常强悍的推理性能，尤其在数学、编程和推理任务上达到了与 OpenAI 的o1模型相当的水平。

DeepSeek-V3

推理速度大幅提升，位居开源模型之首，媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练，性能显著增强。

QwQ-Plus

通义千问 QwQ 推理模型增强版，基于 Qwen2.5 模型训练的 QwQ 推理模型，通过强化学习大幅度提升了模型推理能力。

QwQ-32b

通义千问 QwQ Plus 开源版本，基于 Qwen2.5 模型训练的 QwQ 推理模型，通过强化学习大幅度提升了模型推理能力。

Qwen2.5-Max

一个大规模 MoE 模型，已在超过 20 万亿个 token 上进行了预训练，并使用精选的监督微调 (SFT) 和从人类反馈中强化学习 (RLHF) 方法进行了进一步的后训练。

Qwen2.5-72b-instruct

阿里云最新大语言模型，在编码、数学、多语言支持（29+种语言）及结构化数据处理（如JSON）方面有显著提升。

Llama-3.1-Nemotron-Ultra-253B-v1

基于Meta的Llama-3.1-405B-Instruct（参考模型）衍生的大型语言模型（LLM），专注于推理能力优化，支持128K长上下文，并针对人类对话偏好、RAG（检索增强生成）及工具调用等任务进行后训练。

Llama-3.3-Nemotron-Super-49B-v1

基于 Meta Llama-3.3-70B-Instruct（参考模型）优化的大型语言模型（LLM），专注于推理能力，并针对人机对话偏好、RAG（检索增强生成）及工具调用等任务进行后训练。该模型支持 128K tokens 长上下文，适用于复杂推理和高交互场景。

相关文档

使用教程

获取 API 密钥

DeepSeek-R1/V3 和 Qwen2 大模型 API 说明

支持的 DeepSeek-R1/V3 和 Qwen2 大模型列表

常见问题集合

最佳实践

Agentic AI 干货！DeepSeek + OpenAI SDK 构建 Agent 实战

DeepSeek R1 GPU 主机部署教程

DeepSeek R1 蒸馏模型 GPU 主机部署教程

聊天客户端 NextChat 配置说明

聊天客户端 Cherry Studio 配置说明

浏览器插件 PageAssist 配置说明

开源知识库问答 MaxKB 配置说明

聊天客户端 Chatwise 配置说明

这些客户信赖我们

相关产品

内容审核

提供图片、视频等内容的审核服务，精准识别过滤色情、暴恐、敏感人物等违规内容

画质增强

基于七牛领先的深度学习技术，提供视频画质增强服

云服务器

提供云服务器、负载均衡、云数据库、高防等服

智能数字人

更形象、更智能的数字人

在线咨询

在线咨询电话咨询

智能客服