财通证养CAITONG SECURITIES行业专题报告/证券研究报告1DeepSeek-V3正式发布,性能对齐海外头部模型DeepSeek-V3正式发布。l2月26日,深度求索DeepSeek发布了其DeepSeek-V3模型。该模型是一款强大的混合专家(MoE)语言模型,拥有671B参数,激活37B,在14.8 T token上进行了预训练。在多种任务中表现卓越,训练高效且成本效益显著。图1.DeepSeek发布DeepSeek-V3模型deepseekg你好,请问你是第几代d0ops0ck横型y好1我是DeepSeek-V3,一个由深童求素公司开发的指能助手,我会尽我所能为龙提供相助,ocop心开已新对话给DeepSeek发送息阅爱立市中害西内有油仙生成,清了数据来源:De©pS©ek-V3模型官方,财通证泰研究所DeepSeek-V3在多项基准测试中表现优异,比肩世界顶鮫撲型。根据DeepSeek发布的最新论文,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.l-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT4o(0513版本)以及Claude-3.5-Sonnet不分伯仲。如下图2所示,在MATH500(EM)测试中,DeepSeek-V3的准确率最高,为90.2%;在Codeforces(Percentile)测试中,DeepSeek-V3的准确率为51.6%,是可比模型中最高。图2.DeepSeek-V3及其同类产品的基准性能比较100MMLL-PreGPO-DIa1E2024数据来源:DeepSeek官月,财通证泰研究所谨请参阅尾页重要声明及财通证券股票和行业评级标准
暂无评论内容