
4月24日,市集期待已久的DeepSeek-V4模子预览版庄重发布。新模子复旧百万token(词元)超长险阻文,DeepSeek称其在智能体才能、天下学问和推感性能上均罢了国内与开源畛域的率先。
按参数畛域不同,DeepSeek-V4系列分为DeepSeek-V4-Pro和DeepSeek-V4-Flash两个版块。前者的总参数目达1.6万亿、激活参数为490亿;后者的总参数目为2840亿,激活参数为130亿。
尽管轻量版DeepSeek-V4-Flash的参数目更小,但推理才能接近DeepSeek-V4-Pro,在初始智能体简单任务上与DeepSeek-V4-Pro旗饱读相称,但在高难度任务中仍有差距。官方称DeepSeek-V4-Flash主打性价比,梗概提供愈加速捷和经济的API干事。
时期讲明注解指出,DeepSeek-V4系列在长险阻文场景中具有极高的后果。和上一代DeepSeek-V3.2模子比较,DeepSeek-V4-Pro大幅缩短了对计较和显存的需求。在100万险阻文建树下,DeepSeek-V4-Pro的单token推理计较量仅为DeepSeek-V3.2的27%,KV缓存(一种加速模子推理生成的机制)仅为其10%。DeepSeek称这收获于一种全新的防范力机制研究。
“这使咱们梗概在实践诈欺中健硕复旧百万级险阻文,从而使万古序任务愈加可行。”时期讲明注解写说念。
具体性能推崇上,时期讲明注解露出,DeepSeek-V4-Pro-Max(即DeepSeek-V4-Pro的最大推理强度方式)的智能体才能与月之暗面Kimi-K2.6和智谱GLM-5.1等率先的开源模子推崇相称,火狐(中国)官方IOS|Android手机app下载但略逊于顶级闭源模子。在里面评估中,DeepSeek-V4-Pro-Max高出Anthropic的Claude Sonnet 4.5,并接近其2025年11月推出的Opus 4.5的水平。
学问才能方面,DeepSeek-V4-Pro-Max在多个测试基准上权贵优于率先的开源模子,仍逾期于谷歌旗下的顶尖闭源模子Gemini-3.1-Pro,不外差距已权贵减轻。
推感性能上,DeepSeek-V4-Pro-Max展现出优于GPT-5.2和Gemini-3.0-Pro的推崇,但仍略低于GPT-5.4和Gemini-3.1-Pro。时期讲明注解称这标明其发展水平约莫逾期刻下发轫进前沿模子约3至6个月。
DeepSeek未在时期讲明注解中指出新模子预巡逻所使用的具体芯片型号和畛域。而在DeepSeek-V3的时期讲明注解中,曾袒露该模子巡逻仅使用了2048块英伟达H800 GPU。
抢庄牛牛APP官网下载不外,华为方面在DeepSeek-V4模子发布后默示,华为昇腾芯片一直同步复旧DeepSeek系列模子,本次通过两边芯模时期空洞协同,罢了昇腾超节点全系列产物复旧DeepSeek-V4系列模子。华为称,昇腾950超节点能罢了高隐约、低时延的DeepSeek-V4模子推理部署。
DeepSeek-V4模子的发布,正好DeepSeek公司被曝初次对外融资之际。据科技媒体The Information报说念,腾讯和阿里巴巴正在洽谈投资DeepSeek,估值跳动200亿好意思元。腾讯和阿里对此未公开回复。
采写:南齐N视频记者 杨柳火狐(中国)官方IOS|Android手机app下载