“百模大战”下半场：野蛮生长后，如何避免重复“造轮子”？

　　中新网北京12月2日电 (记者夏宾)今年以来，全球科技领域最重要的风向，就是新一轮人工智能大模型竞赛。随着美国OpenAI公司发布ChatGPT一鸣惊人，中国科技界不遑多让、纷纷接招，国内大模型总数一度逼近100个，“百模大战”盛况吸引全球关注，大模型的发展速度日新月异。

　　生成式人工智能技术正在逐步改造重塑人类社会、经济、文化等各个领域的能力。伴随着国内开启“百模大战”，大模型在写文章、对话、企划、写代码等很多领域表现出了让人惊艳的创作能力，并且每天都在快速进化。

　　业内专家认为，这一技术带来的产业红利才刚刚初露峥嵘，AIGC与数字经济、实体经济的深度融合，还将创造出更多颠覆性的社会价值、经济价值，有望开启一场关系到未来数十年的新一轮技术和产业变革。

　　有分析观点认为，上述进化和变革，都需要夯实大模型技术底座的广域和跨度，需要通过大量智能计算，耦合人工智能底层技术与基础软件，营造安全可信的人工智能生态，加快推动应用落地，深入垂直领域，构建建立在高质量通用大模型底座上的技能模型、行业模型等的增长飞轮。

　　近日在京举行的人工智能计算大会(AICC2023)吸引了来自智谱AI、IDEA研究院、百川智能、循环智能、网易伏羲、中国科学院自动化研究所等机构的大模型专家，分享多模态、超长上下文、开源数据集等大模型技术话题，并将就大模型的技术路线、训练的工程化挑战与开源生态建设展开对话碰撞。

图说：人工智能计算大会(AICC　2023)近日在京举行。摄影：主办方供图

　　同时，大会在1500m2的实景AI创新科技展中设置“助百模”专区，集结业内顶尖的基础大模型和行业大模型，通过实时交互系统展示大模型技术魅力。

　　浪潮信息也于近日正式发布千亿级开源大模型源2.0，同时宣布源大模型共训计划，呼吁开发者一起训练大模型，构建繁荣的开源生态。作为千亿级别的开源大模型，源2.0在编程、推理、逻辑等方面再进化，为大模型创业者和开发者提供更加丰富、全面的助力，以及更开放的技术创新空间。

　　应看到，面对“AI时代”的来临，“单打独斗”已不适应大科学时代的科技创新。“百模大战”进入下半场，野蛮生长后，“群模时代”来临，行业格局经历洗牌重组，优胜劣汰，正在逐渐成形。

　　有观点称，经过众多科技探索和市场试错，业界共识也已经逐渐明晰：繁荣的开源模型生态体系是吸纳、培养用户的重要途经，也是避免当下AI大模型企业重复造轮子的商业新范式。

　　一方面，大模型需要巨量资金的持续投入，B端市场同样面临这个问题，从这一点说，大公司做大模型更有优势和可持续性，能够保持长期的重型投入，不断迭代，这个能力对于B端市场十分重要。

　　另一方面，“众人拾柴火焰高”，以优秀的开源模型性能汇聚技术创新力量，以技术创新反哺大模型数据、工具、应用的迭代升级，才能为全球开发者、研究机构、科技企业提供坚实的底座和成长的土壤，激发无穷创新力。

　　浪潮信息高级副总裁刘军认为，应对生成式AI的发展和挑战，应该从算力系统、AI Infra、算法模型、产业生态四个层面创新，通过大模型算力效率、模型算法等创新有效提升基础大模型能力，以健康产业生态助推“百模千行”应用落地。

　　浪潮信息人工智能软件研发总监吴韶华则对中新网记者表示，开源的通用大模型是未来最先进生产力的“地基”，地基的稳固度和厚度决定了建筑的高度。筑基“高智商的”通用大模型基座，算力是核心驱动力，如何用同样多的算力，更高质量的数据，换取更低的损失率，把算力更有效地匹配智能涌现，这是促进产业良性发展的核心关键。(完)

【编辑:姜雨薇】

相关推荐