资讯频道 > > 正文
2025-03-31 22:28:12
来源:zclaw

编程能力大大提拔(ba),DeepSeek发布更新版V3模(mo)型,始创公司,网站,Sonnet

字体:

参考(kao)音讯网3月25日报导 据新加坡《联合早报》网站3月25日报导,我国始创公司深度求索(DeepSeek)发布了V3模(mo)型更新,增强了模(mo)型的编程能力,显(xian)示这家公司进展在野生智能(AI)领域的猛烈合作中连结领先(xian)优势。

综合彭博社和科技博客网站“风险投资节奏”网站的报导,AI开源模(mo)型DeepSeek-V3的更新版本V3-0324于24日深夜在AI开源平台低调(diao)上线。

深度求索没有为此次版本更新发布任(ren)何公告,连续了该(gai)公司的低调(diao)气势派头。

初代DeepSeek-V3发布于2024年12月26日,这款模(mo)型自上线后便以高性价比(bi)敏捷(jie)“出圈”。根据官方技术论(lun)文表露,DeepSeek-V3模(mo)型的总训练本钱约为557.6万美元,而OpenAI的GPT-4o等模(mo)型的训练本钱约为1亿美元。

更新后的DeepSeek-V3模(mo)型巨细(xi)为641GB,模(mo)型参数为6850亿。与(yu)V3相同,V3-0324模(mo)型采用混合专(zhuan)家(MoE)架构,并开源同意自由商用。

此次更新的最(zui)大亮点(dian)是编程能力的优化。有网民使用V3-0324模(mo)型编写800多行(xing)代码,全程没有出现任(ren)何以障(zhang)。

有AI研讨者在社交平台X上发布评测指出,V3-0324模(mo)型在所有基准(zhun)测试中都(dou)获得巨大前进,大概已超(chao)越美国Anthropic公司的Claude 3.5 Sonnet,成为最(zui)壮大的非推理模(mo)型。Claude 3.5 Sonnet是当前最(zui)受承认的商业AI模(mo)型之一。

让更多科技博主存眷的是,V3-0324模(mo)型可间接在消耗级硬件上运行(xing),如搭载苹果M3 Ultra芯片的Mac Studio上,而没有必(bi)要动(dong)辄千(qian)瓦(wa)级别(bie)功耗的数据中心。

M3 Ultra芯片在举(ju)行(xing)推理时的功耗没有到200瓦(wa),意味着V3-0324模(mo)型的安(an)排和运营门(men)坎已大大降(jiang)低。

“风险投资节奏”网站报导认为,DeepSeek-V3-0324模(mo)型的发布,大概预示着DeepSeek-R2即将到来。DeepSeek一贯先(xian)推出基础模(mo)型,再推出特地(di)优化推理能力的版本,如V3后没有久发布的R1。

路透社今年2月引述音讯称,DeepSeek正加快推出R1模(mo)型的后续产物R2。据悉(xi),DeepSeek-R2原设计在5月初发布,但公司现在进展尽早推出。

“风险投资节奏”网站认为,DeepSeek-R2的发布,大概成为间接挑战GPT-5的竞品。

用户在DeepSeek手机客户端(duan)上提问(新华社发)

发布于:北(bei)京市
【纠错】 【责任编辑:zclaw】

Copyright ? 2000 - 2025 All Rights Reserved.