G广发证券GF SECURITIES深度分析引计算机目录索引一、DEEPSEEK-V3上线,模型性能提升较快6(一)沿用前代MLA+MOE架构,训练成本大幅降低…6(二)模型兼具低成本与高性能的特点..7二、DEEPSEEK V3大模型测评9(一)DEEPSEEK密文解码推理能力突出,但空间推理能力弱于豆包大模型10(二)DEEPSEEK空间几何和数学计算能力行业平均水平相当.15(三)针对程序开发场景,DEEPSEEK生成内容更符合开发者要求.22(四)DEEPSEEK生成文本的质量符合行业平均水平27三、数据与算法仍有潜力可待挖掘,算力依旧不可或缺33(一)数据与算法仍有潜力可待挖掘.33(二)算力是A大模型的发展动力,依旧不可或缺33四、风险提示.35识别风险,发现价值请务必阅读末页的免责声明3/37
暂无评论内容