2020年11月8日上午10点,由暨南大学汉语方言中心、暨南大学发音语音学实验室主办的第八期汉语方言语音记录与分析研究班系列讲座第十一讲在暨南大学第二文科楼904汉语方言研究中心进行,本次讲座采用线上的形式进行。此次讲座也是2020“广东省研究生学术论坛/暑期学校”项目组成部分。
祖漪清老师毕业于南京大学和中国社会科学院研究生实验语音学专业,目前任职于科大讯飞股份有限公司。负责多语种研发的祖漪清老师就“平行与对应—方言语音合成识别中的语言学问题”专题做学术讲座,本次讲座由刘新中教授主持,语言学及相关专业学生到场聆听。
图为讲座的有关内容
首先,祖漪清老师简介iFLYTEK方言智能语音技术状况以及科大讯飞公司的产品,有讯飞听见、讯飞输入法、讯飞录音笔等。其次谈到方言语音合成、识别的现状是识别率高的方言使用人口多,可以获得大量数据,多为官话区,而非官话区则资源受限,困难重重。这也反映了在方言研究和方言信息处理中的共同难点。第二,祖老师介绍了传统方法对端到端新技术的推动作用。老师认为平行的本质是在语言的两个基本模态之间建立关系。第三,祖老师讲述了方言语音合成数据库的制作存在困难,比如:方言口语和书面语不一致,录音环境不适合以及语音合成数据库发音人的选择不容易等。还谈到了传统合成音库音段标注问题,提出汉语方言研究的重要问题,比如,声调和连续变调等问题。同时提到资源受限语言端—端解决方案的困难。因为方言识别是一项高人力成本的工作,数据成本远远高于语音合成。对于资源受限语言和方言的语音合成与识别,祖老师以藏语东嘎输入法为例,讲述了涟漪效应,希望对其他语言、方言的合成、识别有示范、引领的作用。最后,祖老师就语言、方言实际样态做了总结,具体表现为,方言一定会不断变化,基本语音单元呈现简化趋势,专家对相同事物的理解也是多方位的。鉴于此,祖老师提出语音学和音系学结合能更好地促进研究发展,而AI技术一定会促进未来语言学的研究和应用。
图为讲座现场
在师生互动环节,祖老师和在座师生就方言语音合成识别等相关问题进行了热烈讨论。此次讲座有很强的专业性,让我们了解了方言语音识别技术存在的困难和前沿知识,参加讲座的师生纷纷表示受益匪浅。
(撰稿:黄荣华 摄影:杨玉婷)