“百模大战”下半场:野蛮生长后,如何避免重复“造轮子”?

发布时间:2024-12-31 03:13:51 来源: sp20241231

   中新网 北京12月2日电 (记者 夏宾)今年以来,全球科技领域最重要的风向,就是新一轮人工智能大模型竞赛。随着美国OpenAI公司发布ChatGPT一鸣惊人,中国科技界不遑多让、纷纷接招,国内大模型总数一度逼近100个,“百模大战”盛况吸引全球关注,大模型的发展速度日新月异。

  生成式人工智能技术正在逐步改造重塑人类社会、经济、文化等各个领域的能力。伴随着国内开启“百模大战”,大模型在写文章、对话、企划、写代码等很多领域表现出了让人惊艳的创作能力,并且每天都在快速进化。

  业内专家认为,这一技术带来的产业红利才刚刚初露峥嵘,AIGC与数字经济、实体经济的深度融合,还将创造出更多颠覆性的社会价值、经济价值,有望开启一场关系到未来数十年的新一轮技术和产业变革。

  有分析观点认为,上述进化和变革,都需要夯实大模型技术底座的广域和跨度,需要通过大量智能计算,耦合人工智能底层技术与基础软件,营造安全可信的人工智能生态,加快推动应用落地,深入垂直领域,构建建立在高质量通用大模型底座上的技能模型、行业模型等的增长飞轮。

  近日在京举行的人工智能计算大会(AICC2023)吸引了来自智谱AI、IDEA研究院、百川智能、循环智能、网易伏羲、中国科学院自动化研究所等机构的大模型专家,分享多模态、超长上下文、开源数据集等大模型技术话题,并将就大模型的技术路线、训练的工程化挑战与开源生态建设展开对话碰撞。

图说:人工智能计算大会(AICC 2023)近日在京举行。摄影:主办方供图

  同时,大会在1500m2的实景AI创新科技展中设置“助百模”专区,集结业内顶尖的基础大模型和行业大模型,通过实时交互系统展示大模型技术魅力。

  浪潮信息也于近日正式发布千亿级开源大模型源2.0,同时宣布源大模型共训计划,呼吁开发者一起训练大模型,构建繁荣的开源生态。作为千亿级别的开源大模型,源2.0在编程、推理、逻辑等方面再进化,为大模型创业者和开发者提供更加丰富、全面的助力,以及更开放的技术创新空间。

  应看到,面对“AI时代”的来临,“单打独斗”已不适应大科学时代的科技创新。“百模大战”进入下半场,野蛮生长后,“群模时代”来临,行业格局经历洗牌重组,优胜劣汰,正在逐渐成形。

  有观点称,经过众多科技探索和市场试错,业界共识也已经逐渐明晰:繁荣的开源模型生态体系是吸纳、培养用户的重要途经,也是避免当下AI大模型企业重复造轮子的商业新范式。

  一方面,大模型需要巨量资金的持续投入,B端市场同样面临这个问题,从这一点说,大公司做大模型更有优势和可持续性,能够保持长期的重型投入,不断迭代,这个能力对于B端市场十分重要。

  另一方面,“众人拾柴火焰高”,以优秀的开源模型性能汇聚技术创新力量,以技术创新反哺大模型数据、工具、应用的迭代升级,才能为全球开发者、研究机构、科技企业提供坚实的底座和成长的土壤,激发无穷创新力。

  浪潮信息高级副总裁刘军认为,应对生成式AI的发展和挑战,应该从算力系统、AI Infra、算法模型、产业生态四个层面创新,通过大模型算力效率、模型算法等创新有效提升基础大模型能力,以健康产业生态助推“百模千行”应用落地。

  浪潮信息人工智能软件研发总监吴韶华则对 中新网 记者表示,开源的通用大模型是未来最先进生产力的“地基”,地基的稳固度和厚度决定了建筑的高度。筑基“高智商的”通用大模型基座,算力是核心驱动力,如何用同样多的算力,更高质量的数据,换取更低的损失率,把算力更有效地匹配智能涌现,这是促进产业良性发展的核心关键。(完)

【编辑:姜雨薇】