DeepSeek惊艳世界，算力与应用将迎来结构性变化-东方证券-2025-2-4

manyouzhe

1年前发布

2.12MB18页0335

第1页 / 共18页

第2页 / 共18页

第3页 / 共18页

第4页 / 共18页

第5页 / 共18页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

东方证券ORIENT SECURITIES计算机行业深度报告一DeepSeekf惊艳世界，算力与应用将迎来结构性变化图表目录图1：DeepSeek-.V3在多项评测中成绩领先..4图2：DeepSeek-.V3在各类测试集上的表现.….5图3：DeepSeek-V3API服务价格具备很强的吸引力..…..5图4：DeepSeek-.R1在推理能力上比肩OpenAl o1..6图5：基于R1蒸馏的小模型性能超越OpenAl o1-minl....…6图6：DeepSeek-.R1API服务定价继续大幅低于OpenAl o1..7图7：DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源.7图8：DeepSeek成为全球增速最快的Al应用.……..…………….…...….….……….8图9：DeepSeek发布后下载量增长迅猛.8图10：DeepSeek-V3模型基本架构.8图11：DeepSeek-V3采用FP8为主的混合精度训练方法..9图12：多To水en预测(MTP)模块结构示意…………10图13：R1-Zr0由基础模型直接进行强化学习训练而产生.……………………10图14：DeepSeek-R1-Zero圳练期间AlME准确率....11图15：DeepSeek-.R1-Zer0在RL过程中的平均响应长度（输出长度不断增加）11图17：“杰文斯悖论”指出成本下降将刺激资源需求更大增长..12图18：硅基流动×华为云联合推出基于异腾云的DeepSeek R1&V3推理服务13图19：A产品榜全球Wb端访问前15情况(24年12月)…………………14图20：A1产品榜全球APP端访问前15情况(24年12月).14图21：2024年全球A1产品付费用户规模…14图22：shot-CoT模式下，k1.5模型多方面能力领先..15图23：long-CoT模式下，k1.5模型多方面能力比肩o1..15图24：Qwen2.5-Max测试结果领先各类指令模型......15图25：Qwen2.5-Max表现优于各类开源模型..15有关分析师的申明，见本报告最后部分。其他重要信息被靠见分析师申明之后部分，或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。3

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容