DeepSeek-V3：6710亿参数开启国产AI新纪元开源在即！

更新时间：2025-05-11 23:12:13 发布时间：99天前浏览：6246 评论：0

内容摘要　　近日，“深度求索”官方公众号传来重磅消息，DeepSeek-V3模型已正式上线，源代码也随之开放。你只需访问网，便能与这一强大的新模型互动。让我们一起探索这项令人振奋的技术！　　DeepSeek-V3被称为一颗闪耀的AI之星，拥有惊人的6710亿参数，采用了专家混合（MoE）模型结构，能够将复杂的问题空间巧妙地划分为多个同质

　　近日，“深度求索”官方公众号传来重磅消息，DeepSeek-V3模型已正式上线，源代码也随之开放。你只需访问网，便能与这一强大的新模型互动。让我们一起探索这项令人振奋的技术！

　　DeepSeek-V3被称为一颗闪耀的AI之星，拥有惊人的6710亿参数，采用了专家混合（MoE）模型结构，能够将复杂的问题空间巧妙地划分为多个同质区域，大大提高了其处理能力。

　　在预训练阶段，这款模型一次性处理了高达14.8万亿的token，并成功激活了370亿参数。这不仅让DeepSeek-V3在众多评测中表现优秀，更是以超越Qwen2.5-72B与Llama-3.1-405B等开源模型的表现，与世界顶尖闭源模型如GPT-4o和Claude-3.5-Sonnet一较高下！

　　无论是在知识检索、长文本处理，还是代码生成与数学题解方面，DeepSeek-V3的表现都可圈可点，尤其在算法代码与数学问题上表现尤为出色。此外，它的生成速度也达到了令人惊叹的60TPS，相比V2.5版提升了3倍！

　　为了便于开发者的使用，官方不仅开源了原生FP8权重，还提供了BF16转换脚本，目前如SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。

　　在API服务方面，DeepSeek也进行了价格调整：在新的定价策略下，每百万输入tokens的费用为0.5元（缓存命中）或2元（缓存未命中），每百万输出tokens的价格为8元。为了让更多用户提前感受新模型的强大功能，DeepSeek特地推出了长达45天的优惠体验期！从即日起至2025年2月8日，无论是老用户还是新用户，均可享受每百万输入tokens为0.1元（缓存命中）或1元（缓存未命中），输出tokens的优惠价格为2元。

　　DeepSeek-V3的上线极大推动了国产AI技术的发展，也为更多开发者和企业带来了新的机遇。无论是科研、商业还是个人研发，这款模型都将是你不容错过的强力助手！返回搜狐，查看更多

举报收藏打赏 评论 0