DeepSeek 团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与 OpenAI 的o1模型相当的水平。
推理速度大幅提升,位居开源模型之首,媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练,性能显著增强。
通义千问 QwQ 推理模型增强版,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。
通义千问 QwQ Plus 开源版本,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。
一个大规模 MoE 模型,已在超过 20 万亿个 token 上进行了预训练,并使用精选的监督微调 (SFT) 和从人类反馈中强化学习 (RLHF) 方法进行了进一步的后训练。
阿里云最新大语言模型,在编码、数学、多语言支持(29+种语言)及结构化数据处理(如JSON)方面有显著提升。
基于Meta的Llama-3.1-405B-Instruct(参考模型)衍生的大型语言模型(LLM),专注于推理能力优化,支持128K长上下文,并针对人类对话偏好、RAG(检索增强生成)及工具调用等任务进行后训练。
基于 Meta Llama-3.3-70B-Instruct(参考模型)优化的大型语言模型(LLM),专注于推理能力,并针对人机对话偏好、RAG(检索增强生成)及工具调用等任务进行后训练。该模型支持 128K tokens 长上下文,适用于复杂推理和高交互场景。