通信-行业周报：DeepSeek-V3推进技术突破与创新，降低模型开发门槛-AI行业跟踪45期

manyouzhe

1年前发布

0.75MB9页0425

第1页 / 共9页

第2页 / 共9页

第3页 / 共9页

第4页 / 共9页

第5页 / 共9页

该文档为免费文档，您可直接下载完整版进行阅读

文章版权归作者所有，未经允许请勿转载。

THE END

智慧城市

文本预览

西部任春行业周报」通信2025年01月05日一、AI行业重点事件点评1.1 DeepSeek-V3训练和使用成本大幅降低，或有望助力商业端落地DeepSeek-V3是由中国人工智能公司深度求索于2024年12月26日推出的一款自研混合专家(MoE)模型，旨在突破当前大语言模型的性能瓶颈。该模型拥有6710亿参数和370亿激活参数，在14.8万亿tokn上完成了预训练，同时率先采用无辅助损失的负载均衡策略和多令牌预测训练目标以增强模型性能。作为一款开源模型，DeepSeek-V3支持在线使用和本地部署，在多项评测中超越了其他开源模型，并在性能上与顶尖闭源模型相媲美。DeepSeek公司通过创新的技术和架构设计推动了大模型的发展，DeepSeek-V3不仅在性能和成本控制方面实现了显著突破。图1：DeepSeek-V3与主流模型在多领城测评任务中的表现对比0.340MMLL-PreMATH 500AIME 2024SWE-bench Verified资补未源：51CT0。西部证养研发中心性能提升结果：英语任务、代码评测、数学任务和中文任务等多项测评成绩领先。)在英语任务中，模型在MMLU(EM0和MMLU-Redux(EM中分别取得88.5%和89.1%的准确率，表现接近甚至超越部分闭源模型，并在DROP(3-shot F1)中以91.6%领先所有对比模型。2)在代码评测中，DeepSeek-V3在HumanEval--Mul和LiveCodeBench等测试中表现优异，生成与理解能力接近甚至超越GPT-4o和Claude-3.5-Sonnet。.3)在数学任中，模型以39.2%(AIME2024)和90.2%(MATH-500)的准确率位居前列，展现了强大的数学推理能力。在美国数学竞赛和全国高中数学联赛等专业任务中，DeepSeek-V3的表现同样远超同类模型，包括Meta的Llama-3.1-405B和OpenAl的GPT-4o。4)在中文任务中，DeepSeek-V3在CLUEWSC、C-Eval和C-SimpleQA测试中排名第一，显示了其深厚的中文处理实力。5)此外，在长文本任务中，模型在DROP评测中以91.6%的准确率领先。这些评测结果进一步证明了DeepSeek-V3在语言理解、生成和多任务适应性方面的先进性，展现了广泛的应用潜力。3|请务必仔细阅读报寺尾部的授资评极说明和声明wERN西部证券

喜欢就支持一下吧

请登录后发表评论

登录注册

暂无评论内容