DeepSeek研究框架

manyouzhe

1年前发布

4.94MB52页0366

第1页 / 共52页

第2页 / 共52页

第3页 / 共52页

第4页 / 共52页

第5页 / 共52页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

国海证券SEALAND SECURITIESDeepSeeki引领全球AI创新，一定程度上也影响了全球AI格局，并提振了国内AI产业信心。我们看好由DeepSeek带来的AI产业、尤其是国内AI产业的发展机遇，包括AI应用、端侧AI、算力等三个方向。◆DeepSeek(深度求索)专注大模型技术，V3和R1模型惊艳海内外DeepSeek(深度求索)成立于2023年7月，由量化资管公司幻方量化创立，DeepSeek专注于开发先进的大语言模型(LLM)和相关技术。2024年1月5日，发布第一个大模型DeepSeek LLM:12月26日，上线DeepSeek-V3并同步开源，DeepSeek-V3采用FP8训练，性能对其世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet。.2025年1月20日，发布DeepSeek-R1,DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩OpenAl o1正式版。DeepSeek-R1推出后广受关注，据Appfigures、Sensor Tower报告，1月26日以来，深度求索(DeepSeek)发布的DeepSeekAl智能助手爆火，在全球140个市场的应用商店下载榜上排名第一。DeepSeek V3和R1模型基于Transformer:架构，采用了MLA和DeepSeek MoE两大核心技术，引入了多令牌预测、FP8混合精度训练等创新技术，显著提升了模型的训练效率和推理性能。DeepSeek创始人梁文锋表示“V2模型没有海外回来的人，都是本土的”。DeepSeek代表中国本土AI大模型，也代表开源AI走在了全球AI市场的前列。◆DeepSeek对全球Al行业影响颇深：激发创新、提振国产、推广开源1)DeepSeek成为了全球AI的一条“鲶鱼”。DeepSeek发布或导致全球AI格局变化，中美Al形势生变，全球Al被“鲶鱼”激活。预计美系Al会不断反应，全球Al模型迭代和发布频率将提速，投入继续加大。自1月20日DeepSeek-R1发布以来，OpenAli连续发布了Agent operator,O3mini、Deep Research等模型，OpenAI CEO表示GPT-5将是超级混合模型，计划把GPT和o系列模型整合在一起。2)DeepSeek驱动国产Al估值重塑。我们认为：长期以来，算力和技术是制约国内Al估值的主要因素，DeepSeek在国内AI芯片受限的环境里，通过本土AI团队，探索出一条“算法创新+有限算力”的新路径，较大地提振了国内A产业信心。DeepSeek-R1的推出或同时打破了抑制国产A产业的技术和算力这两项天花板，将驱动国产AI软件硬件迎估值重塑。3)DeepSeek,是开源AI的“ChatGPT时刻”。OpenAl CEO首次承认OpenAli的闭源策略“站在了历史错误的一边”。DeepSeek-R1开源将会吸引更多人参与到大模型研发中，并通过蒸馏等技术显著提升推理Al、小模型的性能，将大幅加速全球AI创新，加速AI推理进程，普惠AI、Al平权将驱动DeepSeek迅速推广，近期全球CSP大厂密集上架DeepSeek能力也验证了这点，我们预计Killer APP的诞生或将临近。请务必阅读报告附注中的风险提示和免责声明3

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容