近日,“深度求索”官方公众号传来重磅消息,DeepSeek-V3模型已正式上线,源代码也随之开放。你只需访问网,便能与这一强大的新模型互动。让我们一起探索这项令人振奋的技术!
DeepSeek-V3被称为一颗闪耀的AI之星,拥有惊人的6710亿参数,采用了专家混合(MoE)模型结构,能够将复杂的问题空间巧妙地划分为多个同质区域,大大提高了其处理能力。
在预训练阶段,这款模型一次性处理了高达14.8万亿的token,并成功激活了370亿参数。这不仅让DeepSeek-V3在众多评测中表现优秀,更是以超越Qwen2.5-72B与Llama-3.1-405B等开源模型的表现,与世界顶尖闭源模型如GPT-4o和Claude-3.5-Sonnet一较高下!
无论是在知识检索、长文本处理,还是代码生成与数学题解方面,DeepSeek-V3的表现都可圈可点,尤其在算法代码与数学问题上表现尤为出色。此外,它的生成速度也达到了令人惊叹的60TPS,相比V2.5版提升了3倍!
为了便于开发者的使用,官方不仅开源了原生FP8权重,还提供了BF16转换脚本,目前如SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。
在API服务方面,DeepSeek也进行了价格调整:在新的定价策略下,每百万输入tokens的费用为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens的价格为8元。为了让更多用户提前感受新模型的强大功能,DeepSeek特地推出了长达45天的优惠体验期!从即日起至2025年2月8日,无论是老用户还是新用户,均可享受每百万输入tokens为0.1元(缓存命中)或1元(缓存未命中),输出tokens的优惠价格为2元。
DeepSeek-V3的上线极大推动了国产AI技术的发展,也为更多开发者和企业带来了新的机遇。无论是科研、商业还是个人研发,这款模型都将是你不容错过的强力助手!返回搜狐,查看更多
0 条