通信行业周报：DeepSeek火出圈，重视AIDC产业链及端侧AI投资机会

manyouzhe

1年前发布

0.78MB13页0585

第1页 / 共13页

第2页 / 共13页

第3页 / 共13页

第4页 / 共13页

第5页 / 共13页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

之开源证券行业周报]I、周投资观，点：DeepSeek火出图，重视AIDC产业链及端侧AI投资机会1.1、DeepSeek登顶下载排行榜，长期或特大幅提升推理侧算力需求2025年1月27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的一款多模态AI工具，专注于自然语言处理和代码生成等任务。DeepSeek成立于2023年7月，由知名私募巨头幻方量化孕有而生，致力于开发先进的大语言模型(LLM)和相关技术。相比其他大模型，DeepSeek具有以下技术特点和优势：√高性能与低成本：DeepSeek在性能上表现出色，其最新发布的DeepSeekV3模型在多项基准测试中优于GPT-4等主流闭源模型。这得益于DeepSeek在算法和工程上的优化，使得模型在保持高精度的同时，显著降低了计算负担。例如，DeepSeek-V3的训练成本仅为560万美元，远低于同类产品的数亿美元投入。√双语处理能力：DeepSeek在2万亿个中英文token的数据集上进行预训练，展现出强大的双语处理能力，使得其在处理中英文混合内容或跨语言任务时具有更高的准确性和效率。√混合专家(MoE)架构：DeepSeek大模型采用混合专家(MoE)网络结构，这种设计使得模型能够智能地选择不同的专家模型进行计算，针对不同的任务激活相应的网络分支，从而实现了计算资源的高效利用。√多模态处理能力：DeepSeek不仅限于文本处理，还进军了文生图领域。其发布的Janus-.Pro多模态大模型在GenEval和DPG-Bench基准测试中击败了Stable Diffusion和OpenAI的DALL-E3,展现了其在多模态处理能力上的卓越表现。DeepSeek自发布以来便受到了市场的热烈追捧。其应用程序在苹果应用商店的下载量持续攀升，甚至一度超越ChatGPT成为美区免费应用榜单的榜首。用户对DeepSeek的反馈普遍积极，许多用户表示其在回答问题和生成内容方面表现出色，能够准确地理解用户需求并提供高质量的答案。DeepSeek在2024年底发布了新一代大语言模型V3,并宣布开源。测试结果显示，该模型在多项评测中表现优于主流开源模型，且具有成本优势。此外，DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引发全球关注。我们认为DeepSeek的主要贡献是推动AI模型降本，使AI服务更加普及和实惠，用户将能以更低的价格享受到高质量的AL服务。DeepSeek因其自身训练成本相对较低，因此在定价方面有更大的空间，C端可以免费使用，API接入的费用也明显更低，有望驱动后续A[模型的需求及AI应用的加速爆发，有望带动全球A应用繁荣，长期或将大幅提升推理侧算力需求。请务必参阅正文后面的信息被露和法律声明3/13

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容