互联网-浅谈DeepSeek的成本和跟行业对比

manyouzhe

1年前发布

1.25MB6页0527

第1页 / 共6页

第2页 / 共6页

第3页 / 共6页

第4页 / 共6页

第5页 / 共6页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

互联网入华泰证券HUATAI SECURITES图兼3：Lama与DeepSeek提型刘棒数希对比公司MetaDeepSeek械型Llama 2Llama 3Llama 3.1DeepSeek-V1DeepSeek-V2DeepSeek-V3发布日期2023年7月2024年2月2024年6月2024年1月2024年5月2024年12月参数量7B70B70B405B67B236B671B训练Token2.0T2.0T15T15T2T8.1T14.8T上下文窗口4k8k128k4k128K128KGPUNVIDIA A100-80GBNVIDIA H100 Tensor CoreNVIDIA H800GPU训栋小时0.18M1.7M6.4M30.8M172.8K300.6K2.8M资补未源：Me通um、华泰研究国表4：DeepSeek R1与OpenAlo1模型API刘用价格对比（年百万Token):(美元)输入价格（美元）■输出价格（美元）70160.063.0605040302015.015.015.812.6100.84.00.60.70.91.114.45.03.03.0323.23.53.50Llama 3.3Claude 3.5DeepSeeko3-miniGemini 1.5 Claude 3.5DeepSeeko1-miniLlama3.101o1-preview70BHaikuV3ProSonnetR1405资未源：Artificial Analysis、Analyfics Vidhya、华泰所究国表5：DeepSeek的枝术灌告(Technical Paper)发表情况，均在Arw里辰示论文名称发表时间DeepSeek LLM:Scaling Open-Source Language Models with Longtermism2024/15DeepSeek-Coder:When the Large Language Model Meets Programming-The Rise of Code Intelligence2024/126DeepSeek-VL:Towards Real-World Vision-Language Understanding20243/11DeepSeek-V2:A Strong,Economical,and Efficient Mixture-of-Experts Language Model20246/19DeepSeek-Coder-V2:Breaking the Barrier of Closed-Source Models in Code Intelligence20246/17DeepSeek-Prover-V1.5:Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search20248/15DeepSeek-V3 Technical Report2024/1227DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning2025/122注：以v是一个开放的学术文章特策，由康奈尔大学摊护和运营。av0g不进行同行评审。然而，所有提文的文章都要经过一个审核过，该过程根据主题领城对材料选行分奏，并检壶其学术价值。作者可在向期刊和峰会提文前成同时向V提文预印本文章。资补来源：AV、华泰所究风险提示大樸型技术研发进展不及市场预期：大模型研发具有较高的不骑定性，可能因技术突破受阻、算法优化困难、计算资源不足等因素导致进展缓慢不及市场预期。實易科枝季擦风险：若中美贸易与科技摩擦风险加刷，或将导致DeepSeek数据使用遭受审查，对于公司产品选代造成潜在负面影响。本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。免袁声明和城露以及分斯狮声明是捉的一部分，请务必一起阅读。3

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容