已故大师“复现”,数智人大学还远吗

发布时间:2024-11-22 00:41:49 来源: sp20241122

  “您好,蒋院士!请问您在华东师范大学读书时印象最深的事情是什么?”

  “在华东师大读书时,我印象最深的是1990年深秋,潘道暟先生鼓励研究生们自己去参加学术会议。我与戴立益一起参加第三届全国量子化学会议,结识了许多专业领域的顶尖人物,这次经历点燃了我的新志向。”

  2024年1月,在华东师范大学上海普陀校区的理科大楼二楼软件工程学院大厅,一块一人高的电子屏幕上,出现的是已故中国科学院院士、中国科学院上海药物研究所原所长、华东师大校友蒋华良的形象。屏幕中的“蒋华良”,是该校软件工程学院国家工程中心副主任、高级工程师王江涛团队研发的数智人形象,该项目的发起人是华东师大校长、中国工程院院士钱旭红,牵头人是蒋华良的学生、华东师大药学院院长李洪林。数智人能模拟蒋华良院士的语气、南方普通话口音以及说话的形态等,并与提问者自然对话。

  “我们未来可能建成全球首个数智人教育平台——数智人大学,采用文理工大跨度交叉、虚拟与现实深度融合方式,建立数智人的关键技术标准,打造数智人的标准化应用与数据库,不断完善‘数智化’评价治理体系。”钱旭红介绍,未来各种数智人可能会出现在华东师大的各个角落,与师生互动。

  “复现”大师难度远超想象

  “爸爸虽然不在了,但能以这样的形式让他‘复现’,对我们来说也是一种陪伴。”蒋华良院士的女儿蒋雨惜说,她全程参与了用新技术“复现大师”的过程。

  从2023年4月开始,蒋雨惜每个月都会与王江涛团队至少沟通一次,“项目组团队每个月会根据我、我母亲和李洪林老师的意见更新迭代数智人模型,然后再让我们提意见”。

  蒋雨惜提出的意见,包括“与父亲的语气不太一致”“父亲的南方普通话口音问题”“表情有些太生硬”“眨眼睛的频次太低”等。

  为了塑造一个更加真实的“蒋华良”,王江涛团队想了很多办法。比如,他们前期向蒋院士的亲朋好友收集了大约450条数据,每一条数据都要人工核对,删除部分无用数据。数据确定后,他们要用大模型算法,让数智人对数据内容进行学习——不过,由于数据总量不算多,数智人训练2万次和5万次,所表现出来的区别不大。

  “我们能获得的数据非常有限,这是‘复现大师’的一个难点。”王江涛介绍,团队“复现大师”的想法最早是校长钱旭红提出的。早在3年前,在“中国哲学社会科学国际化研究前沿”跨学科项目中,华东师大就首次提出了数智人概念,结合教育、管理、心理、大数据、计算机等学科基础先行探索。两年前,王江涛团队尝试“复现”过2017年逝世的华东师大老校长袁运开,当时受制于数据不够、技术不强等因素,“复现”效果一般。

  那时采用的,是如今直播中普遍使用的数字技术——需要一个真人在后台讲话、做动作,再由电脑合成声音和形象——还不是真正运用大模型算法的数智人。这种技术,一方面对“演员”表演技术要求高,要能模拟老校长的言行举止,另一方面对前台数字形象制作的要求也高,很难做到“生动”,数字形象可以说话,但无法做到与人对话。

  两年后,在蒋华良院士数智人实验上,王江涛团队要实现更高的目标——不仅不再需要后台“演员”,还要求数智人的表情生动、自然,能够与师生亲朋实现“对话”。

  用算法“教会”数智人“说话”

  前期的研发,总会出现这样那样的问题。一个数智人的推出,包括发音驱动和形象驱动两个方面,哪怕只是一个细微的面部表情,都是由后台算法时时刻刻计算出来的。

  “一开始,数智人说话时,身体总是在摇晃,还不会眨眼睛。”华东师大软件工程学院工程师徐刚负责蒋院士数智人的形象驱动部分,他告诉记者,由于蒋院士生前视频资料多为公开场合的讲座、演讲、发言等,表情相对正式,所以机器对其形态进行学习时,往往捕捉不到“眨眼睛”这个动作。后来,团队成员一方面联系家属收集院士的日常生活视频,另一方面修改后台算法,解决数智人说话时眼神和身体不自然的问题。

  蒋华良院士是江苏常州人,他讲话时有比较重的南方口音,这也需要后台进行专门的计算模拟。团队成员介绍,最开始的版本有些生硬,蒋院士的家人和学生都不满意。一眼就能辨识出是“数字人”——既不逼真,也不智能。

  语气、表情、神态处理好了,下一步的难点是让数智人“把话说准确”。为此,研发团队收集了蒋院士生前大量的文字素材,内容涵盖其所专注的药物专业领域、有关他带学生的故事等,此外还有个人生活、业余兴趣爱好等。其中,个人生活方面,华东师大专门为蒋院士召开了一场追思会,由他的生前好友、同事、学生、家属等一一回忆他的生活点滴和有趣的故事。“数据收集越多,研发出来的数智人,回答问题的能力就越强。”王江涛说。

  随之而来的问题是,数智人在学习了大量文献后,经常“一回答就说个不停”。这与蒋华良院士生前讲话“言简意赅、准确到位”并不相符。

  为此,给数智人的回答“设置边界”,又被研究团队提上了日程。

  华东师大软件工程学院副研究员姚俊杰负责大模型的底层数据优化,他和同事们的工作是让数智人有认知能力。数智人不仅要悉数掌握蒋院士的生平、事迹,还要对药学、生物学等领域的相关知识了如指掌。

  “一开始我们做的数智人会使用很多情绪词,问一个问题,他会把所有相关的内容一股脑儿地倒出来。”姚俊杰说,蒋华良院士的数智人创新,一定程度上也是华东师大未来教师数智人的预演,“不管将来换成哪个领域的其他老师,都会面临设置边界、让数智人把话说准确的问题”。

  数智人的想象和应用空间有多大

  人工智能不仅是自然科学与工程技术领域的问题,同样也是人文社会科学领域关注的问题。

  中国社会科学院科学技术和社会研究中心副主任、哲学研究所助理研究员雷环捷就预测,未来人工智能一定会驱动人文社会科学的研究。

  比如,在课程教学中,人工智能可以协助教师生成课程大纲、习题作业等教学材料,还可以答疑解惑;在人才培养过程中,人工智能可以帮助学生训练辩证、批判、创新等思维,形成独立思考和解决问题的能力。在学科建设中,人工智能还能促进新的研究方法和思路的产生,不仅有助于一些新兴学科和交叉学科的孵化,还有助于基础学科、重点学科、冷门学科找到新的生长点。

  实际上,华东师大已经在校园内逐步尝试“高仿真数智人(视频)教学”,由高仿真的“教授”制作了一堂教育部产学合作协同育人项目的数据分析课程;该校还出品了“小花狮作文智能辅导系统”,辅导对象为三年级到九年级中小学生,它基于大语言模型技术,为上千所中小学孩子提供智能化评估及反馈。

  目前,华东师大已建构出国内首个大模型综合教育能力评测框架,研制出我国第一个专门面向教育领域的大语言模型“EduChat”。

  王江涛告诉记者,无论是袁运开校长的数智人,还是蒋华良院士的数智人,都属于前期探索。未来,数智人的应用场景可以在档案馆、博物馆、校史馆等,“可以让历史人物重现,也许公众可以和李白一起赋个诗、和鲁迅来一场交流?”

  再比如,学生学习英语的需求,也可以通过数智人来满足,“现在一个英语老师或许只能与几名学生充分对话、上小课,未来如果有仿真的英语系教授给孩子上课,他可以和更多的孩子实现‘一对一’”。

  王江涛介绍,团队目前还在与对外汉语专业人士对接,尝试设计一个数智人来教外国人汉语,“如果每天都有一个汉语数智人教师陪你聊天、练普通话,你的汉语水平是不是会有很大长进?”

  中青报·中青网记者 王烨捷 来源:中国青年报 【编辑:曹子健】