智源盘考院林咏华：多模态模子需求繁华，但基础身手仍有造就空间

中国黄金网

你的位置：中国黄金网 > 黄金价格 >

发布日期：2024-12-22 13:51 点击次数：114

（原标题：智源盘考院林咏华：多模态模子需求繁华，但基础身手仍有造就空间）

21世纪经济报说念记者雷晨北京报说念

本年下半年以来，大模子经验了狞恶的淘汰赛，少数用户活跃度高的大模子脱颖而出，参预决赛圈。与此同期，各界关于这些模子的性能施展、发展后劲等方面的暖热有增无已。

近期，北京智源东说念主工智能盘考院（简称：智源盘考院）发布并解读了国表里100余个大模子的抽象及专项评测规矩，涵盖说话、视觉说话、文生图、文生视频、语音说话等多个范围。

围绕大模子发展趋势、行业近况及关连热门问题，智源盘考院副院长兼总工程师林咏华与21世纪经济报说念等媒体进行了一场深度对话，从专科视角对大模子的发展趋势、行业近况以及关连热门问题进行说明。

互联网大厂上风明显，模子发展仍具后劲

林咏华指出，互联网大厂在大模子范围具有权贵上风。在说话模子方面，凭借苍劲的流量上风，大厂能获得更多用户反应，鼓舞数据飞轮，在主不雅评测中施展精良。举例字节、快手等公司，在文生图、文生视频范围，因本身短视频平台积蓄的高质料数据而逾越于非互联网厂商。

针对前OpenAI融合首创东说念主、SSI首创东说念主Ilya提议的预训诲停滞不雅点，林咏华给以反驳。她默示，刻下互联网存在数据孤岛风物，多数数据未被充分应用，华文数据在各人占比下落，但使用华文上网东说念主数未变。同期，海量视频数据也有待挖掘，以促进模子对寰宇的通晓学习，大模子发展仍有宏大后劲。

模子发展态势分化，多模态后劲突显

智源评测规矩炫耀，2024年下半年大模子发展呈现新趋势：多模态模子发展马上，新厂商与新模子不休理会，在K12学科测试中，会通说话和视觉的多模态模子施展出色，其集结和推理身手更强。说话模子发展则相对放缓，开源的第一梯队模子已达到较高水平，持续造就需更多革命，模子尺寸出现南北极分化，除大型稠密模子外，7B或以下小模子下载量也较高。

林咏华合计，多模态模子需求繁华，但基础身手仍有造就空间，揣度2025年将有更多新模子出现。关于资金不彊但革命身兄弟的团队，可在多模态模子的拼接、预处置、后处置、学习方式等方面进行革命。

AI应用趋势明确，算力需求将造就

林咏华还对AI应用趋势进行了揣度。她默示，2024年说话模子基础身手造就，鼓舞了复杂应用发展，2025年基于说话模子的Agent将成为热门，用于构建更复杂的AI应用和系统。文生图、文生视频应用也将在2025年迎来发展，VLM多模态模子在企业的落地场景世俗，异日需造就基础身手以酿成新应用。

跟着模子发展，对算力需求也将变化。林咏华提到，端侧模子正在发力，异日端云衔尾将成趋势，小模子和大模子将离别承担不同职责，以均衡资源耗尽与成果造就。

开源生态捏续发展，国表里差距仍存

在模子开源生态方面，除了刚毅开源的机构外，新的开源孝顺者不休出现。林咏华同期指出，中国在大模子技能范围与海外先进水平比拟，在数据和AI系统方面存在差距，包括各样数据资源及算力。异日，国内需加强数据引诱，造就算力水平，以鼓舞大模子技能的进一步发展。

让建站和SEO变得简单