清华团队推出新颖唇语解读系统 研究成果发表在最新的《自然·通讯》期刊上

2022-04-06 10:28:38   来源:科技日报

人说话时嘴唇动作跟语音同步,可以通过识别唇动信息进行语言信息交流。唇语对讲话者友好,但是对解读唇语的听众来说却并不轻松,唇语解读一直以来是个难题,掌握唇语解读技能的成本较高。

据了解,为降低唇语解读难度,现有技术手段常采用磁场、视觉图像、超声波等方法。以最流行的非接触式视觉图像方法为例,其唇语识别准确率较高,但依然容易受到面部角度、光强、头动和遮挡等因素干扰。特别是在此次新冠病毒流行期间,佩戴的口罩给基于视觉的唇动解读带来全新挑战。因此,通过直接捕捉面部肌肉细微动作解读唇语技术具有重要的科学研究价值与广阔的应用前景。

如果在不久的将来,嘴唇掀动——“开门”,也许电子门禁能秒懂,马上识别身份并解锁;与汽车对话——“左拐”,或许可控制车的方向逐渐向目标移动;对于声带、喉舌损伤的失声人群,唇语可能将是一种不占用双手的、日常无障碍交流的有效方式……

这些想法,在日清华大学机械工程系智能与生物机械团队推出一种新颖的唇语解读系统之后,将很有可能梦想成真。相关研究成果发表在最新的《自然·通讯》期刊上。

据了解,这项技术的主要试验和测试工作由清华机械工程系智能与生物机械实验室完成,中科院纳米能源与系统研究所的王中林院士对整个科研工作过程进行建议和指导。

那么,究竟这项唇语解读系统的新颖之处何在?“这个基于深度学辅助自供电柔传感器的唇语解读技术,目标是解决声带、喉舌损伤失声人群的日常无障碍交流问题,其不占用双手,不受面部角度、光强、遮挡和头动等外部因素的干扰,新颖之处在于开发自供电的柔传感器(灵敏度0.61183 V/kPa)采集肌肉的微小动作信号,并采用基于原型学的深度学模型,使用较少的数据训练,测试准确率可达94.5%,实现即时捕捉失声人群的唇动并转译成语音,可用于失声人群的日常无障碍语音交流。”3月29日,该论文第一作者、清华大学机械工程系智能与生物机械团队助理研究员路益嘉在接受科技日报记者采访时表示。

这个唇语解读系统是否会运用大数据、人工智能等技术,突破的技术瓶颈是什么?路益嘉答道,“实现对唇动信号的识别需要用到人工智能技术和机器学算法。在实际测试中发现,由于不同人的面部骨骼肌肉、肌肉运动形式、肌肉动作先后顺序和惯语速等存在不同,即使是同一个词和同一句话,采集到的信号也有区别,为了得到通用的可以接受的测试准确率,需要采集海量的数据进行模型训练。然而,这样的成本偏高。”

据介绍,研究人员没有采用训练通用模型的技术路线,而是采用训练个化的小样本量数据模型的方法,即对每个人的每个词(或每句话)分别采集小样本量(相对海量数据而言)的数据进行模型训练,考虑到每人说话的唇动都具有独特的惯特征,这样训练出的模型缺少通用但更有针对,而不考虑通用的要求降低模型对训练数据量的需求,小样本量也能得到可接受的测试准确率。研究人员使用基于原型学的空洞循环神经网络,来减少模型对训练样本量的需求。例如,在测试中对20个常用水果名称的唇动信号进行分类训练,每个水果名称的唇动信号选取100个样本,测试准确率达94.5%。

这项研究将在哪些领域应用,发挥作用?“该研究通过自供电传感器采集唇动微动信号,并使用深度学模型将信号识别为有含义的语音信号或文字信号,比较适合服务失声人群,在日常生活交流中可恢复失声人群的基本语音交流能力,并保留失声前的说话惯。”路益嘉表示。

此外,其还可应用于个人身份识别。研究人员制作出一个唇动指令开门的应用演示。由于该方法融合特定密码口令的静态特征和个人特殊的唇部动态特征,可以实现双重特征验证,特别是戴口罩不发声说密码的方式可进一步提升系统安全,适用于安全验证要求较高的场合。

该研究成果还可用于人机交互的研究。研究人员制作出一个唇动信号控制模型车运动方向的应用演示,通过检测唇动发出的方向指令,机器模型车可改变行进方向。这为现有人机交互方案提供了新的可能

标签: 清华团队 唇语解读 唇语解读系统 研究成果

相关阅读

期待!世界机器人运动员8月大比拼

科技

2025世界人形机器人运动会将于8月中旬在国家速滑馆冰丝带上演,机器人将参加田径、足球、武术、自由体操等诸多项目的消息,将期待值拉满。

2025-07-03

AI拓展信息通信业新天地

科技

  江苏宿迁固能科技有限公司积极探索机器人与AI技术的深度融合,在生产过程中实现工艺自动化和智能化,大大提高了生产效率和产品

2025-07-03

太空新基建:中国商业航天提速

科技

4月24日是第十个中国航天日。中国商业航天正迎来技术突破和规模爆发的双重拐点,太空经济从愿景正走向现实。商业航天,一般指以市场化方式

2025-05-06

人工智能与软件双向赋能 第四届中国国际软

科技

  4月24日,由中国软件行业协会主办的第四届中国国际软件发展大会在京举办。本届大会以人工智能与软件变革为主题,深入探讨人工

2025-05-06

人形机器人在“浙”崛起

科技

2025嘉兴马拉松比赛上,宇树科技机器人在现场同观众互动。 章勇涛摄智澄英达研发的智能复合型人形机器人TR4正在进行化学试验。 智澄英达

2025-05-05

发挥网络安全保险在网络安全风险治理中的积极作用

科技

自2023年7月工业和信息化部与国家金融监督管理总局联合印发《关于促进网络安全保险规范健康发展的意见》之后,我国的网络安全保险进入发展

2025-07-03

2025全球数字经济大会明日在京召开

科技

据悉,2025全球数字经济大会将于7月2日在北京国家会议中心召开。本届大会将举办新技术新产品新方案首发首秀特色活动,并围绕人工智能融合应

2025-07-03

AI产业迈入规模化应用新阶段

科技

 今年以来,人工智能行业不断上演神仙打架,新模型层出不穷。在日前召开的2025上海世界移动通信大会开幕式上,国家互联网信息办公室副

2025-07-03

与“中国速度”竞赛

科技

  电动化与智能化变革浪潮,不仅在加速汽车产品进化,也在深刻重构市场竞争格局。中汽协数据显示,今年前5个月,中国品牌乘用车

2025-07-03

“AI+医疗”产业化提速

科技

 人工智能如何更有效地服务人们的健康需求?医疗行业该如何把握人工智能时代的机遇?日前,在第四期通用健康大讲堂上,业内专家指出,

2025-07-03

数智赋能 交通重大工程建设加速推进

科技

 时至年中,从川西北高原的川汶高速到松花江畔的超级桥梁,从北京城市副中心站综合交通枢纽到河北高速的智慧改扩建工程,在数字化、智

2025-07-03

AI工具只需一次脑扫描即可识别多种痴呆症

科技

美国妙佑医疗国际的研究人员开发出一款人工智能工具,仅通过单次脑部代谢扫描数据,就可以帮助医生识别出包括阿尔茨海默病在内的9种常见痴

2025-07-03

期待!世界机器人运动员8月大比拼

科技

2025世界人形机器人运动会将于8月中旬在国家速滑馆冰丝带上演,机器人将参加田径、足球、武术、自由体操等诸多项目的消息,将期待值拉满。

2025-07-03

营造直播带货良好生态

科技

 市场监管总局日前发布《直播电商监督管理办法(征求意见稿)》,面向社会公开征求意见,意在加强直播电商监督管理,促进直播电商健康

2025-07-03

乐见平台经济破“卷”重生

科技

 健康市场中的低价,应是商家通过技术创新、规模效应、供应链优化等正当手段实现的合理低价。这种低价是可持续的,既能保证商家的合理

2025-07-03

遇见旗袍是于万千人群中的惊鸿一瞥 沿途洒满了爱的芬芳

旗袍,中国和世界华人女性的传统服装,被誉为中国国粹和女性国服。虽然其定义和产生的时间至今还存有诸多争议,但它仍然是中国悠久服饰文化

北京市电影院有序恢复开放 周五预售部分场次已满座

7月21日,北京市政府发布《北京市电影局关于在疫情防控常态化条件下有序推进电影院恢复开放的通知》,宣布全市低风险地区影院,可于7月24日

近期持续强降雨影响 第46届武汉渡江节因长江水位过高取消

武汉7·16渡江节组委会14日发布公告,由于长江武汉关水位超警戒水位,按照规定取消2020年第46届武汉7·16渡江节。受近期持续强降雨影响,

“非遗”普及受众最看重“动手”参观大师工作室非常享受

过去一段时间,国家级非遗项目灰塑传承人邵成村,多次在陈家祠等工作现场,向身边那些带着好奇目光的人们讲解灰塑的种种技术细节:草根灰、

璧山冷酒夜市 丰富市民夜间文旅活动

7月13日,位于璧山区南门唐城夜市街区的璧山冷酒夜市开街。这是璧山区打造夜间经济消费载体、培育夜间经济活动品牌的举措之一。璧山市民一

日播时尚2024年亏损1.59亿元,能否顺利重组转型“双主业”受关注

中国网财经2月26日讯 日播时尚2024年年报近期出炉。报告期内,日播时尚实现营业收入8 66亿元,同比下降15 7%;归母净利润为-1 59亿元,而

年内两市超过500家上市公司完成回购 累计回购金额超332亿元

近期A股市场持续震荡,不少上市公司或其重要股东推出回购、增持计划,用真金白银力挺股价。记者根据同花顺数据统计,今年以来,两市超过500

持续发力补链强链加大研发抢占市场 渝企跑出“加速度”

玥湖路渝快电充换电站 一辆新能源汽车,离不开研发、动力、配套等多个环节。作为汽车制造重镇,重庆在这些环节的多个板块上,正在加速奔跑

重启上市公司资本运作 康佳集团去年半导体业务营业收入为3.22亿元

近日,康佳集团正式对外发布2021年年度业绩报告。2021年,康佳集团实现全年营收491 07亿元,归属于母公司的净利润为9 05亿元,同比增长89 5

伟禄集团连续6年增长 去年营收同比增长37.5%

深港通标的之一的深圳企业伟禄集团近日公布2021年业绩。财报数据显示,伟禄集团全年营业收入11 95亿港元,同比增长37 5%,连续6年稳步增长;

龙头企业去年净利倍增 整个行业营收规模有望创造历史新高位

近日,面板龙头TCL科技、京东方分别发布2021年度业绩快报,两家企业去年归属于上市公司股东的净利润分别增长129 3%、412 86%,实现超过百亿