AI 大模型推理服务

AI 大模型推理服务为企业提供高效、稳定、安全的模型推理服务,支持DeepSeek-R1、Qwen2.5等主流开源大模型,并整合了图文识别(OCR)、语音文字识别(ASR)、文字转语音(TTS)、多媒体介质存储(对象存储)和输入输出(RTC快直播)等丰富的音视图文能力,帮助客户、开发者轻松实现服务智能化集成及智能应用开发。
模型列表

DeepSeek-R1

DeepSeek 团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与 OpenAI 的o1模型相当的水平。

DeepSeek-V3

推理速度大幅提升,位居开源模型之首,媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练,性能显著增强。

QwQ-Plus

通义千问 QwQ 推理模型增强版,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。

QwQ-32b

通义千问 QwQ Plus 开源版本,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。

Qwen2.5-Max

一个大规模 MoE 模型,已在超过 20 万亿个 token 上进行了预训练,并使用精选的监督微调 (SFT) 和从人类反馈中强化学习 (RLHF) 方法进行了进一步的后训练。

Qwen2.5-72b-instruct

阿里云最新大语言模型,在编码、数学、多语言支持(29+种语言)及结构化数据处理(如JSON)方面有显著提升。

Llama-3.1-Nemotron-Ultra-253B-v1

基于Meta的Llama-3.1-405B-Instruct(参考模型)衍生的大型语言模型(LLM),专注于推理能力优化,支持128K长上下文,并针对人类对话偏好、RAG(检索增强生成)及工具调用等任务进行后训练。

Llama-3.3-Nemotron-Super-49B-v1

基于 Meta Llama-3.3-70B-Instruct(参考模型)优化的大型语言模型(LLM),专注于推理能力,并针对人机对话偏好、RAG(检索增强生成)及工具调用等任务进行后训练。该模型支持 128K tokens 长上下文,适用于复杂推理和高交互场景。

这些客户信赖我们
相关产品

内容审核

提供图片、视频等内容的审核服务,精准识别过滤色情、暴恐、敏感人物等违规内容

查看更多 >

画质增强

基于七牛领先的深度学习技术,提供视频画质增强服

查看更多 >

云服务器

提供云服务器、负载均衡、云数据库、高防等服

查看更多 >

智能数字人

更形象、更智能的数字人

查看更多 >