科学家研发出人工智能声呐眼镜,可识别唇语,准确率高达95%


(相关资料图)

美国康奈尔大学的研究人员最近成功开发了一款声呐眼镜,它能够通过声学感应和人工智能技术来识别嘴唇和嘴巴的动作,从而连续识别多达31个无声命令。

该系统的成功开发将为那些暂时不方便说话或无法发声的人提供非常有用的帮助。比如,那些有语言障碍或喉咙疾病的人,以及那些在公共场所不方便大声说话的人。

这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

声呐眼镜是由可穿戴技术和深度学习算法组成的。它通过穿戴者的嘴部和喉咙的声音发射出去的特殊频率来进行声学感应,从而识别嘴巴和嘴唇的动作。随着深度学习算法的发展,声呐眼镜识别命令的能力也不断提高,现在已经能够连续识别多达31条无声的命令。

在测试中,研究人员让用户进行一系列的肢体动作和嘴唇动作,声呐眼镜可以精确识别这些动作的细微变化,非常可靠地识别命令,并输出相应的命令触发器。

这项技术的研究成果将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表,届时研究人员将详细介绍声呐眼镜的工作原理和应用前景,以及未来的研究方向。

它的发明将为那些暂时不方便说话或无法发声的人带来更好的生活体验,让他们可以更加自如地与世界互动。未来,我们期待该技术能够更加成熟和普及,为更多需要的人们带来帮助。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《2023-2028年中国眼镜制造行业发展前景预测与投资战略规划分析报告》同时前瞻产业研究院还提供产业大数据、产业研究、政策研究、产业链咨询、产业图谱、产业规划、园区规划、产业招商指南、IPO募投可研、IPO业务与技术撰写、IPO工作底稿咨询等解决方案。

关键词:

来源:前瞻网
编辑:GY653

免责声明:本网站内容主要来自原创、合作媒体供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

  • 相关推荐

相关词