更新时间:2025-03-25 16:54:16点击:
深度求索(DeepSeek)发布了V3模型更新,加强了模型的编程能力,显示这家公司希望在人工智能(AI)激烈竞争中保持领先优势。AI开源模型DeepSeek-V3的版本更新V3-0324星期一(3月24日)深夜在AI开源平台HuggingFace低调上线。

DeepSeek没有为此次版本更新发布任何公告,延续了该公司的低调风格。
初代DeepSeek-V3发布于2024年12月26日,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。
更新后的DeepSeek-V3模型大小为641GB,参数量6850亿。与V3相同,V3-0324模型采用专家混合(MoE)架构,并开源允许自由商用。
此次DeepSeek发布的V3版本更新,编程能力的优化成了最大亮点。有网民使用V3-0324模型编写800多行代码,全程没有出现任何故障。
有AI研究者在X发布评测指出,V3-0324模型在所有基准测试中都取得巨大进步,可能已超越美国Anthropic的Claude Sonnet 3.5,成为最强大的非推理模型。Sonnet 3.5是当前最受认可的商业AI模型之一。
V3-0324模型可直接在消费级硬件上运行,如搭载苹果M3 Ultra晶片的Mac Studio上,不需要动辄千瓦级别功耗的数据中心。
M3 Ultra晶片在进行推理时的功耗不到200瓦,意味着V3-0324模型的部署和运营门槛已大大降低。
DeepSeek-V3-0324模型的发布,可能预示着DeepSeek-R2的即将到来。DeepSeek一贯先推出基础模型,再推出专门优化推理能力的版本,如V3后不久发布的R1。
2月引述消息称,DeepSeek正加快推出R1模型的后续产品R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。DeepSeek-R2的发布,可能成为直接挑战OpenAI GPT-5的竞品。
专题:DeepSeek V3
兵种军旗自2025年8月1日启用
互联网平台企业涉税信息报送规定(国令第810号)
中国知名的律师
专业技术人员职业资格考试都有哪些?
2025胡润中国茶业百强县
各地知名的专业律师查询
2024年房地产开发和销售数据
2024年全国各类学校招生、在校生、毕业生数据
2024年全国贷款数据
2025中国茶叶区域公用品牌价值评估报告
如何办理茶叶食品生产许可证SC?
调查问卷信息
网络新闻发布须知
福州市高中排名
虚假交易”的违规类型:刷单刷评和炒信作弊
证券期货业App安全认证获证产品目录
62款完成个人信息收集使用合规整改App清单
华为应用市场应用分类示例
广告不得有下列情形——福建发布2024年第二批虚假违法广告典型案例
2024年福州普高(含综合高中班)录取分数线排名