东方证券ORIENT SECURITIES计算机行业深度报告一DeepSeekf惊艳世界,算力与应用将迎来结构性变化图表目录图1:DeepSeek-.V3在多项评测中成绩领先..4图2:DeepSeek-.V3在各类测试集上的表现.….5图3:DeepSeek-V3API服务价格具备很强的吸引力..…..5图4:DeepSeek-.R1在推理能力上比肩OpenAl o1..6图5:基于R1蒸馏的小模型性能超越OpenAl o1-minl....…6图6:DeepSeek-.R1API服务定价继续大幅低于OpenAl o1..7图7:DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源.7图8:DeepSeek成为全球增速最快的Al应用.……..…………….…...….….……….8图9:DeepSeek发布后下载量增长迅猛.8图10:DeepSeek-V3模型基本架构.8图11:DeepSeek-V3采用FP8为主的混合精度训练方法..9图12:多To水en预测(MTP)模块结构示意…………10图13:R1-Zr0由基础模型直接进行强化学习训练而产生.……………………10图14:DeepSeek-R1-Zero圳练期间AlME准确率....11图15:DeepSeek-.R1-Zer0在RL过程中的平均响应长度(输出长度不断增加)11图17:“杰文斯悖论”指出成本下降将刺激资源需求更大增长..12图18:硅基流动×华为云联合推出基于异腾云的DeepSeek R1&V3推理服务13图19:A产品榜全球Wb端访问前15情况(24年12月)…………………14图20:A1产品榜全球APP端访问前15情况(24年12月).14图21:2024年全球A1产品付费用户规模…14图22:shot-CoT模式下,k1.5模型多方面能力领先..15图23:long-CoT模式下,k1.5模型多方面能力比肩o1..15图24:Qwen2.5-Max测试结果领先各类指令模型......15图25:Qwen2.5-Max表现优于各类开源模型..15有关分析师的申明,见本报告最后部分。其他重要信息被靠见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。3
暂无评论内容