DeepSeek推动“算力平权”，关注端侧AI和Agent投资机会-国金证券-2025-2-7

manyouzhe

1年前发布

2.28MB20页0639

第1页 / 共20页

第2页 / 共20页

第3页 / 共20页

第4页 / 共20页

第5页 / 共20页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

◆国金证券SINOLINK SrCURITIrS扫码获取更多服务行业专题研究报告1.DeepSeek强势崛起，国产大模型技术大幅跃升DeepSeek近期推出了多款大模型，凭借卓越性能和创新技术，迅速在行业内引发强烈反响，效果显著“出圈”。我们认为DeepSeek的突破标志着国产大模型技术迈入全球领先行列，其低成本特性将带动A!应用加速落地。2024年12月深度求索推出DeepSeek-V3,以极低的训练成本，实现了与国际顶尖模型相媲美的性能。具体而言，DeepSeek-V3在知识类任务(MLU,MMLU-Pro,GPQASimpleQA)上的水平相比前代DeepSeek-V2.5显著提升，接近当前表现最好的模型Claude-3.5-Sonnet-1022:长文本测评、代码生成、数学方面平均表现超过其他模型：中文能力与Qwen2.5-72B相近。DeepSeek-V3采用MoE架构，参数规模671B,激活37B,在14.8 T token上进行了预训练。根据DeepSeek-V3论文，其正式训练成本仅为557.6万美元，约为GPT-4预算的1/20。模型完全开源，API价格为每百万输入tokens0.1元（缓存命中）/1元（缓存未命中)，每百万输出tokens2元，显著低于Claude3.5 Sonnet和GPT-4o。围表1：DeepSeek-V3性价比远是GPT-4o希Claude3.5 SonnetDeepSeek-V3·GPT4*Gemini 1.5 Pro.Llama-3.1-405B-Instruct.Qwen2.5-72B-InstructMistral-Large-2411GLM-4-PlusLlama-3.1-70B-Instruct.DeepSeek-V2.5.GPT-4o-miniCauk3.5Hik·ERNIE4.0 Turbo1.00h-l10.00MMLU Redux ZeroEval Score VS Input API Price ($1M Tokens)来源：DeepSeek公众号，国金证泰研究所2025年1月20日，深度求索发布正式版DeepSeek-R1模型，是基于V3基础模型进行微调和强化学习得到的，模型同步开源并实现性能再度提升，在数学、代码、自然语言推理等任务上，性能比肩OpenAl o1正式版。此外，深度求索还在R1的基础上蒸馏了6个开源小模型，其中32B和70B模型在多项能力上实现了对标OpenAl o1-mini的效果。DeepSeek-R1API服务定价为每百万输入tokens1元（缓存命中）/4元（缓存未命中)，每百万输出tokens16元，价格远低于OpenAI--o1。围表2：DeepSeek-.R1在V3之上再提并围表3：DeepSeek-R1推理API定价远低于Open A-o1pesAl-a1-mls4a1是料里模型铺入输出价格（元/1AMTs】DSk月ol rm o】t iew ol4A3E2024MATII-S00来源：DeepSeek公众号，国金证泰研究所来源：DeepSeek公众号，国金证泰研究所散请参因最后一質特别声明3

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容