DeepSeek推动“算力平权”,关注端侧AI和Agent投资机会-国金证券-2025-2-7

DeepSeek推动“算力平权”,关注端侧AI和Agent投资机会-国金证券-2025-2-7-文库
DeepSeek推动“算力平权”,关注端侧AI和Agent投资机会-国金证券-2025-2-7
此内容为免费资源,请登录后查看
0
免费资源

第1页 / 共20页

第2页 / 共20页

第3页 / 共20页

第4页 / 共20页

第5页 / 共20页
该文档为免费文档,您可直接下载完整版进行阅读
© 版权声明
THE END
◆国金证券SINOLINK SrCURITIrS扫码获取更多服务行业专题研究报告1.DeepSeek强势崛起,国产大模型技术大幅跃升DeepSeek近期推出了多款大模型,凭借卓越性能和创新技术,迅速在行业内引发强烈反响,效果显著“出圈”。我们认为DeepSeek的突破标志着国产大模型技术迈入全球领先行列,其低成本特性将带动A!应用加速落地。2024年12月深度求索推出DeepSeek-V3,以极低的训练成本,实现了与国际顶尖模型相媲美的性能。具体而言,DeepSeek-V3在知识类任务(MLU,MMLU-Pro,GPQASimpleQA)上的水平相比前代DeepSeek-V2.5显著提升,接近当前表现最好的模型Claude-3.5-Sonnet-1022:长文本测评、代码生成、数学方面平均表现超过其他模型:中文能力与Qwen2.5-72B相近。DeepSeek-V3采用MoE架构,参数规模671B,激活37B,在14.8 T token上进行了预训练。根据DeepSeek-V3论文,其正式训练成本仅为557.6万美元,约为GPT-4预算的1/20。模型完全开源,API价格为每百万输入tokens0.1元(缓存命中)/1元(缓存未命中),每百万输出tokens2元,显著低于Claude3.5 Sonnet和GPT-4o。围表1:DeepSeek-V3性价比远是GPT-4o希Claude3.5 SonnetDeepSeek-V3·GPT4*Gemini 1.5 Pro.Llama-3.1-405B-Instruct.Qwen2.5-72B-InstructMistral-Large-2411GLM-4-PlusLlama-3.1-70B-Instruct.DeepSeek-V2.5.GPT-4o-miniCauk3.5Hik·ERNIE4.0 Turbo1.00h-l10.00MMLU Redux ZeroEval Score VS Input API Price ($1M Tokens)来源:DeepSeek公众号,国金证泰研究所2025年1月20日,深度求索发布正式版DeepSeek-R1模型,是基于V3基础模型进行微调和强化学习得到的,模型同步开源并实现性能再度提升,在数学、代码、自然语言推理等任务上,性能比肩OpenAl o1正式版。此外,深度求索还在R1的基础上蒸馏了6个开源小模型,其中32B和70B模型在多项能力上实现了对标OpenAl o1-mini的效果。DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,价格远低于OpenAI--o1。围表2:DeepSeek-.R1在V3之上再提并围表3:DeepSeek-R1推理API定价远低于Open A-o1pesAl-a1-mls4a1是料里模型铺入输出价格(元/1AMTs】DSk月ol rm o】t iew ol4A3E2024MATII-S00来源:DeepSeek公众号,国金证泰研究所来源:DeepSeek公众号,国金证泰研究所散请参因最后一質特别声明3
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容