记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。
据介绍,情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)解耦是实现高质量转换效果的关键。由于情感语音中声学特征的解耦更加复杂,面向中性语音的特征解耦一直无法得到很好的处理。
科研团队针对情感语音转换的声学特征解耦问题开展研究,提出了一种基于“源—滤波器”模型的情感语音转换系统,具体来说,是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。
为了进一步提高各种情绪的转化质量,研究团队还提出了基于二维VA(激活度—效价)空间的训练策略。实验结果表明,SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。(记者张景阳 通讯员胡红波)
标签: 情感语音转换技术研究 取得新进展 情感语音 转换技术
记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期
风力发电是一种越来越受欢迎的可再生能源。然而,将风能转化为电能的巨型涡轮机叶片被更换下来如何处置是一个问题。在23日举行的美国化学学
记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期
风力发电是一种越来越受欢迎的可再生能源。然而,将风能转化为电能的巨型涡轮机叶片被更换下来如何处置是一个问题。在23日举行的美国化学学
美国北卡罗来纳大学医学院的科学家们以前所未有的分辨率绘制了年轻人类大脑皮层的表面图,揭示了从出生前两个月到出生后两年关键功能区域的
今夏全球酷热难耐,空调的使用量剧增。但空调中的氢氟烃制冷剂是强效的温室气体,也是气候变化的主要驱动力之一。研究人员在美国化学学会的
俄罗斯研发出一种有效的强放射性废物处理方法,并已获得专利。此项发明是正在开发的核电站乏核燃料创新处理技术的一个阶段,该方法可减少废
俄罗斯研究人员开发出对二氧化碳进行工业处理的新型高效催化剂。除了对环境具有意义之外,所得化合物还具有合成方法简单、成本低和许多其它
目前帕金森病的诊断主要依赖于患者出现的运动症状,例如手抖。但运动症状出现时意味着疾病已经进展了很久。而帕金森病的前驱期,已经存在的
记者从中国科学技术大学获悉,该校卢征天教授团队利用激光冷原子方法对镱-171原子的固有电偶极矩进行了首次测量,获得了该电偶极矩小于上限
旗袍,中国和世界华人女性的传统服装,被誉为中国国粹和女性国服。虽然其定义和产生的时间至今还存有诸多争议,但它仍然是中国悠久服饰文化
7月21日,北京市政府发布《北京市电影局关于在疫情防控常态化条件下有序推进电影院恢复开放的通知》,宣布全市低风险地区影院,可于7月24日
武汉7·16渡江节组委会14日发布公告,由于长江武汉关水位超警戒水位,按照规定取消2020年第46届武汉7·16渡江节。受近期持续强降雨影响,
过去一段时间,国家级非遗项目灰塑传承人邵成村,多次在陈家祠等工作现场,向身边那些带着好奇目光的人们讲解灰塑的种种技术细节:草根灰、
7月13日,位于璧山区南门唐城夜市街区的璧山冷酒夜市开街。这是璧山区打造夜间经济消费载体、培育夜间经济活动品牌的举措之一。璧山市民一