今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。
美国康奈尔大学的研究人员最近成功开发了一款声呐眼镜,它能够通过声学感应和人工智能技术来识别嘴唇和嘴巴的动作,从而连续识别多达31个无声命令。
该系统的成功开发将为那些暂时不方便说话或无法发声的人提供非常有用的帮助。比如,那些有语言障碍或喉咙疾病的人,以及那些在公共场所不方便大声说话的人。
这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。
声呐眼镜是由可穿戴技术和深度学习算法组成的。它通过穿戴者的嘴部和喉咙的声音发射出去的特殊频率来进行声学感应,从而识别嘴巴和嘴唇的动作。随着深度学习算法的发展,声呐眼镜识别命令的能力也不断提高,现在已经能够连续识别多达31条无声的命令。
在测试中,研究人员让用户进行一系列的肢体动作和嘴唇动作,声呐眼镜可以精确识别这些动作的细微变化,非常可靠地识别命令,并输出相应的命令触发器。
这项技术的研究成果将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表,届时研究人员将详细介绍声呐眼镜的工作原理和应用前景,以及未来的研究方向。
它的发明将为那些暂时不方便说话或无法发声的人带来更好的生活体验,让他们可以更加自如地与世界互动。未来,我们期待该技术能够更加成熟和普及,为更多需要的人们带来帮助。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《2023-2028年中国眼镜制造行业发展前景预测与投资战略规划分析报告》同时前瞻产业研究院还提供产业大数据、产业研究、政策研究、产业链咨询、产业图谱、产业规划、园区规划、产业招商指南、IPO募投可研、IPO业务与技术撰写、IPO工作底稿咨询等解决方案。