Al行业关键时刻:瓶颈与机遇并存-国金证券-2024-11-27

Al行业关键时刻:瓶颈与机遇并存-国金证券-2024-11-27-文库
Al行业关键时刻:瓶颈与机遇并存-国金证券-2024-11-27
此内容为免费资源,请登录后查看
0
免费资源

第1页 / 共33页

第2页 / 共33页

第3页 / 共33页

第4页 / 共33页

第5页 / 共33页
该文档为免费文档,您可直接下载完整版进行阅读
© 版权声明
THE END
国金证券SINOLINK SrCURITIrS扫码获取更多服务行业深度研究(深度)一、AI模型趋势:大小模型互补,预训练市场快速收敛,Scaling Law新方向增强推理需求2024年大模型厂商推出模型的速度仍在加快,大模型与小模型共存仍是解决模型能力上限和端侧推理的方案,各大模型厂商也会推出几B到TB级别的模型。随着大型模型训练成本的不断提升,且有更多像Meta、Mixtral、阿里通义等公司的开源,模型预训练市场的玩家会快速缩小,针对特定任务的微调或者是Aget业务将会是更多中小模型厂商发展的重点。在当前算力和数据Scal ing Law放缓的情况下,找到新的Scal ing Law方向是明年模型发展的重点。1.1预训妹和现实数据触顶,后训妹时代将开启新的Scal ing Law方向从24年年初开始有论文提出模型能力提升速度随着参数规模的扩大而放缓,到11月份OpenAl前首席科学家IIya在公开场合表示简单地增加数据和计算能力来扩大当前模型规模的时代已经结束。但是,预训练的scaling law放缓不代表大模型发展速度和算力需求的放缓,就像是芯片gate的实际尺寸停滞在20nm并不影响等效gate密度达到目前的3m,广义的摩尔定律甚至比20年前更快,大模型也需要找到具有更高的投入回报比的新方向。1.2方向一:用推理代替思考0 penAl于2024年9月12日发布了新的AI模型系列o1,这是0penA1首个具有"逻辑推理"能力的模型系列,特别擅长处理复杂的推理任务,尤其是在科学、技术、工程和数学(STE)领域的问题,在这些领域其评测分数都远远超过GPT-4o。o1模型将计算资源从大规模预训练数据集重新分配到训练和推理阶段,增强了复杂推理能力,在费用和成本上也进行了重分配,使用o1-preview的API相比于GPT-4o输入tokens价格是GPT-4o的5倍(每百万tokens$15.00:$3.00),输出tokens差距o1-preview的价格是GPT-4o的6倍(每百万tokens$60.00:$10.00)。围表1:OpenA/o1模型测评分戴对比Competition MathCompetition CodePhD-Level Science Questions(AIME2024)(Codeforces)(GPQA Diamond)0089.010o9338078.378.0806976205676060514040402013.41.094oo1gpt4o o1o1expertpreviewpreviewpreviewhuman来源:0 oenAl、国金证春研究所散诗参阳量后一耳特别声明3
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容