DeepSeek研究框架

DeepSeek研究框架-文库
DeepSeek研究框架
此内容为免费资源,请登录后查看
0
免费资源

第1页 / 共52页

第2页 / 共52页

第3页 / 共52页

第4页 / 共52页

第5页 / 共52页
该文档为免费文档,您可直接下载完整版进行阅读
© 版权声明
THE END
国海证券SEALAND SECURITIESDeepSeeki引领全球AI创新,一定程度上也影响了全球AI格局,并提振了国内AI产业信心。我们看好由DeepSeek带来的AI产业、尤其是国内AI产业的发展机遇,包括AI应用、端侧AI、算力等三个方向。◆DeepSeek(深度求索)专注大模型技术,V3和R1模型惊艳海内外DeepSeek(深度求索)成立于2023年7月,由量化资管公司幻方量化创立,DeepSeek专注于开发先进的大语言模型(LLM)和相关技术。2024年1月5日,发布第一个大模型DeepSeek LLM:12月26日,上线DeepSeek-V3并同步开源,DeepSeek-V3采用FP8训练,性能对其世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet。.2025年1月20日,发布DeepSeek-R1,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAl o1正式版。DeepSeek-R1推出后广受关注,据Appfigures、Sensor Tower报告,1月26日以来,深度求索(DeepSeek)发布的DeepSeekAl智能助手爆火,在全球140个市场的应用商店下载榜上排名第一。DeepSeek V3和R1模型基于Transformer:架构,采用了MLA和DeepSeek MoE两大核心技术,引入了多令牌预测、FP8混合精度训练等创新技术,显著提升了模型的训练效率和推理性能。DeepSeek创始人梁文锋表示“V2模型没有海外回来的人,都是本土的”。DeepSeek代表中国本土AI大模型,也代表开源AI走在了全球AI市场的前列。◆DeepSeek对全球Al行业影响颇深:激发创新、提振国产、推广开源1)DeepSeek成为了全球AI的一条“鲶鱼”。DeepSeek发布或导致全球AI格局变化,中美Al形势生变,全球Al被“鲶鱼”激活。预计美系Al会不断反应,全球Al模型迭代和发布频率将提速,投入继续加大。自1月20日DeepSeek-R1发布以来,OpenAli连续发布了Agent operator,O3mini、Deep Research等模型,OpenAI CEO表示GPT-5将是超级混合模型,计划把GPT和o系列模型整合在一起。2)DeepSeek驱动国产Al估值重塑。我们认为:长期以来,算力和技术是制约国内Al估值的主要因素,DeepSeek在国内AI芯片受限的环境里,通过本土AI团队,探索出一条“算法创新+有限算力”的新路径,较大地提振了国内A产业信心。DeepSeek-R1的推出或同时打破了抑制国产A产业的技术和算力这两项天花板,将驱动国产AI软件硬件迎估值重塑。3)DeepSeek,是开源AI的“ChatGPT时刻”。OpenAl CEO首次承认OpenAli的闭源策略“站在了历史错误的一边”。DeepSeek-R1开源将会吸引更多人参与到大模型研发中,并通过蒸馏等技术显著提升推理Al、小模型的性能,将大幅加速全球AI创新,加速AI推理进程,普惠AI、Al平权将驱动DeepSeek迅速推广,近期全球CSP大厂密集上架DeepSeek能力也验证了这点,我们预计Killer APP的诞生或将临近。请务必阅读报告附注中的风险提示和免责声明3
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容