成果简介
语音识别通常依赖于视觉立体图像和视频,但它经常受到光照强度和面具等不透明遮挡物的限制(如在冠状病毒病2019(COVID-19)大流行期间)。唇语是由口腔内一系列肌肉的运动产生的。因此,读唇语的提取和解码可以通过附加体外传感器来捕捉肌肉运动来实现。本文,浙江理工大学Lin Cheng等研究人员在《J. Mater. Chem. C》期刊发表名为“A highly stretchable and sensitive strain sensor for lip-reading extraction and speech recognition”的论文,研究通过使用二维rGO和导电可拉伸的一维Cu NWs作为混合 “砖块 “和可拉伸的PDMS作为 “砂浆”,制备了一种基于仿生珍珠 “砖-砂浆 “结构的高灵敏度和可拉伸的CuNW-rGO/PDMS压阻式应变传感器。
应变传感器显示出高灵敏度,应变系数为26,拉伸能力范围高达70%,在1000次拉伸-释放循环中具有高耐久性。该传感器贴在皮肤上时可作为健康监测装置,检测各种人体运动,如手掌紧握、肘部弯曲、手腕脉搏跳动和嘴唇运动。通过使用动态时间正则化算法和欧氏距离处理读唇信号,实现了对读唇信号的有效识别。最后,提出了一个完整的系统集成,以实时分析和反馈语音信息,并具有基于应变传感器的语音广播和文字显示功能,以实现准确的语音识别,这为通过捕捉唇部肌肉运动直接将唇部运动转化为语音或文字提供了新的可能性。这项工作提供了一种很有前途的方法,可以帮助声带病变或喉舌损伤的人过上无障碍交流的幸福生活,并将丰富人机界面和无声语音界面中唇语翻译系统的多样性。
图文导读
图1、CuNW-rGO/PDMS应变传感器制造过程示意图。
图2、可拉伸和柔性CuNW-rGO / PDMS混合薄膜的基本表征
图3、CuNW-rGO/PDMS复合应变传感器的电性能
图4、通过CuNW-rGO/PDMS复合应变传感器进行人体运动检测
图5、CuNW-rGO/PDMS复合应变传感器的读唇检测与语音识别应用
图6、(a) 读取一些常用中文和英文短语时传感器的相对电阻变化。(二)8个短语的识别率矩阵。(c) 志愿者佩戴传感器的唇读识别系统的光学图像。(d) 声带受损人士使用唇读识别系统与正常人进行语音和文字无障碍交流的示意图。
小结
综上所述,我们提出了一种简单有效的水热合成和过滤法制备“砖-砂浆”结构CuNW-rGO/PDMS混合薄膜应变传感器的方法。CuNW-rGO/PDMS复合多孔膜传感器由于CuNWs的适度添加和rGO片与CuNWs之间不同接触方式的灵敏度(GF = 26)而表现出优异的导电性。该传感器可以检测超过70%的拉伸应变,并在超过1000次装卸循环中保持出色的稳定性。此外,应变传感器可以安装在身体上,以检测人体运动,例如握手、弯肘和腕脉搏跳动。最后但并非最不重要的一点是,应变传感器安装在嘴唇周围时,可用于唇读信号采集、识别和辅助发音,帮助有语言障碍的人通过无障碍交流过上充实的生活。这项工作在涉及残疾援助、人机界面、无声讲话、情报、反恐任务执行和康复的应用中也具有潜在价值。
文献:https://doi.org/10.1039/D3TC01136D
本文来自材料分析与应用,本文观点不代表石墨烯网立场,转载请联系原作者。