DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

2025-3-26 06:46| 发布者: CZN| 查看: 39| 评论: 0|原作者: 快科技|来自: mydrivers.com

中关村商情网消息，今晚，DeepSeek官宣， DeepSeek V3模型已完成小版本升级。,目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。,虽然是小版本更新，但从反馈来看，这次升级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。,据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术， 大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。,

,同时，在HTML等代码前端任务上，新版V3模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。,在中文写作任务方面， 新版V3模型基于R1的写作水平进行进一步优化，同时特别提升了中长篇文本创作的内容质量。,此外，新版V3模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。,其他方面， 该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。,据DeepSeek介绍，DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型，仅改进了后训练方法。,私有化部署时只需更新checkpoint和tokenizer_config.json（tool calls 相关变动）。,模型参数约660B，开源版本上下文长度为128K（网页端、App和API提供64K上下文）。,与DeepSeek-R1保持一致，此次DeepSeek开源仓库（包括模型权重）统一采用MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。,