策略报告引投资策略天风证券TF SECURITIES1.DeepSeek加速AI大时代DeepSeek开源模型受到广泛关注,其过强化学习等技术,实现了A1大模型的低成本高效推理,加速A1大时代。深度求索公司在2024年12月26日推出了Dee pSeek-V3模型,该模型拥有6710亿参数,采用了创新的Mixture of Experts(MoE)架构,在性能上取得显著进步。不到一个月后,深度求索公司2025年1月20日发布了DeepSeek-R1模型,专注于推理能力的提升,在数学、代码和自然语言推理等任务上表现出色。1月27日,DeepSeek.应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。1月28日,特朗普表示DeepSeek崛起应当为美企敲响“警钟”同时称也可能传递一种积极信号。OpenAl首席执行官Sam Altman表示,DeepSeek的R1模型是一个令人印象深刻的模型。DeepSeek模型引发全球广泛关注。据DeepSeek公司官网介绍,Dee pSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与美国开放人工智能研究中心(Open4/)开发的GPT-o1模型正式版接近。根据赛智产业研究院人工智能研究所副所长安赞表述,DeepSeek-R1通过开源策略、低成本高效推理及强化学习结合混合专家架构(MoE)等创新,实现了突破性的技术进展。开源打破了大企业的技术垄断,促进了A!技术的普惠化。其低成本的算法优化模式改变了长期以来对算力堆砌的依赖,推动了效率导向的竞争格局。DeepSeek的突破和开源,打破了“美国例外”的叙事,显示了开放与创新的■要性,鲇鱼效应明显,有望加速国内A1产业的发展。图1,在目前大模型主流榜单中,DeepSeek-V3在开源模型中位列物首,与世界上最先进的闭横型不分伯仲DeepSeek-V3的综合能力D05G0成V3在事度上历史幢有了大号升在日能大主五佛单中,D种心4*Y的在开浮便中位列物首,与世界上最先法的无模型不分份件Deepteek v3Claade-15Eenchmerk (Metrit72-n4351-ndtSencet-183211ANet时t240*Ttd Paramn47MVEU (M)5NNLU-Redas MMMLU-FIS EMI7EnglshE-tvsl (Pramgt rict)4aPQA-Diamond1021RANES [AcE】70045424H.a-内与LveCodebenc内w与7014224252450A时mt54ANE204e1刊MATH-530 (EM4CHMo 2024 Pam159CLUEWSC TM4C-Eval M61C-nl ICome同615135资料来源:D0S心心k官网,天风证正券研究所请务必阅读正文之后的信息披露和免责申明3
暂无评论内容