“中文+AI”跨界融合新篇章 ——“中文大语言模型应用AI训练营”开班式在暨南大学成功举办

发布时间:2025-11-07 发布单位:文学院


20251030晚上七时,“中文大语言模型应用AI训练营”开班式暨南大学线上线下同步拉开帷幕。训练营由暨南大学汉语方言研究中心、暨南大学-科大讯飞方言语音科技联合实验室、广东省岭南数字人文实验教学示范中心、古联(北京)数字传媒科技有限公司、数字人文专业发展联盟、岭南数字人文联盟联合主办,旨在聚焦中文大语言模型核心应用,主讲方言语音合成和方言虚拟人构建实操技能,为文科学生搭建人工智能学习和实践平台。

参会教师有暨南大学文学院詹伯慧教授、王京州教授、刘新中教授、彭志峰讲师、龙润田副教授、吴南开讲师,数学系龚文勇副教授,教务处杨泽铭老师,实验室与设备处张佳琳老师,团委刘宁老师,科大讯飞祖漪清高级研究员、邵鹏飞研究员中华书局古联公司朱翠萍总编辑、杨光磊老师报名学员有600多人,来自全国近百间高校。

开班式由彭志峰主持,刘新中教授作开班寄语。他指出在人工智能高速发展的时代,专业的重要性日益凸显,强调跨学科合作和自我激励的重要性。课程中的实践部分注重能力和作品的结合,也要强调伦理的重要性,尊重他人劳动成果承担带来的责任以及面向未来的重要性。最后,鼓励学生们早日出现“涌现”能力,并期待他们的成长和进步。

刘新中教授作开班式寄语

王京州教授作开班动员。他认为,2025年相继成立的数字人文专业发展联盟岭南数字人文联盟为中国的数字人文事业奠定了坚实的基础。针对此次训练营的开展,他指出,专业和技术的结合是关键,理论和实践的结合同样是关键,祝愿报名师生在训练营中取得好成绩。

王京州教授作开班动员

朱翠萍总编辑表示训练营聚焦数字人文领域的实际需求,内容新颖,涵盖了人工智能和大语言模型等领域,具有前瞻性和示范性。古联公司成立十年,将聚焦于数智化转型升级,后续将推出数字文献和古籍智能整理培训课程,更好地提升文史哲专业师生数智化技能

科大讯飞祖漪清高级研究员分享多年来在方言语音合成领域的经验,强调在大模型时代,人工并不能完全替代大模型的应用,而应通过学生和老师的共同探索,共同探索方言研究之路。对暨大方言科技团队在方言语音合成和AI大模型应用方面所做的努力和取得的成绩表示高度评价。

祖漪清高级研究员朱翠萍总编辑线上发言

詹伯慧教授对训练营寄予厚望,分享自己对“与时俱进”的理解,强调学科与科技的结合,鼓励全体学员跟上时代的步伐。他回顾2013年起自己带领方言中心团队申报和承担国家社科重大项目的经历,强调文理学科融合对于中文学科转型升级的意义。最后,他感谢为训练营开班作出贡献的各位老师,期望训练营顺利开班

詹伯慧教授寄语“与时俱进”

随后,训练营第一课由科大讯飞邵鹏飞研究员主讲主题是语音合成基础。他指出,语音技术的发展历程已从早期的参数化、机械式合成,跨越至神经网络时代,而大模型的出现则实现了质的飞跃。其核心优势在于强大的上下文理解、知识推理及自我创新能力,能够处理传统模型难以驾驭的复杂情感与韵律,实现了真正的端到端学习。这一技术进步简化了处理流程,通过统一的神经网络框架,有效避免了传统多阶段流程中的信息损失与错误累积。VITS等核心框架的出现,如同一个全自动的智能工厂,用户只需提供高质量文本,系统即可自动完成从文本处理、声学建模到音频生成的全过程。

尽管技术进步显著,但仍面临挑战,尤其是在方言处理方面。高质量、成规模的方言语音数据库极度稀缺,这成为了构建方言大模型的主要瓶颈。因此,语言学专家的作用变得至关重要,他们需深度参与文本设计、声音采集和数据标注等基础工作。解决方言问题的有效途径是利用迁移学习与微调技术,在现有的超大规模预训练底座模型(如在数十万小时数据上训练的Wav2Vec 2.0)之上,进行特定方言的定制化训练。这些强大的底座模型不仅在多语种识别和翻译上表现优异,也为稀缺语言的研究提供了坚实基础。

未来的发展方向聚焦于更广泛的应用,如高保真语音克隆、多模态虚拟人项目等。同时,训练营规划了相应的学习路径,旨在通过课程与实践,让学员掌握数据构建、模型微调等核心技能。课程将引导学生利用现有语言资源,训练方言表达、口音识别乃至虚拟人驱动模型,强调了在实践中学习的重要性,并指出,无论是何种应用,高质量、经过精确标注的数据始终是驱动模型不断进步的根本。

科大讯飞邵鹏飞研究员线上授课

本次AI训练营的内容已在籍合学院正式发布,网址为:

https://app7iixgnpj3504.h5.xiaoeknow.com/p/course/ecourse/preview/course_34RqxxLAHT12KD5bSm1NR7C5b5v?https://mhrza.xetslk.com/sl/1x9LgU

图文:杨玉婷 朱金彩 吴文治

初审:彭志峰 肖丹

复审:王京州

终审:魏霞