实时语音字幕AR眼镜 :帮助听障人士的一大创新

【川透社全译报道】XRAI 科技公司研发的一款AR智能眼镜通过立即将音频转换为字幕来达到实时阅读对话内容的目的,而且特别的是它能够读懂对话过程中人们的面部表情。这一创新无疑改善了那些听障者和多动症患者…

一副出色的AR智能眼镜通过立即将音频样本转换成字幕来让用户“看”到对话,让患有听力障碍或难以集中注意力的人在和他人对话或者周围有对话发生时,能够实时阅读对话内容。科技公司XRAI在利雅得的LEAP 2023科技展会上展示了这一创新成果。

利用最新的尖端技术,这副智能眼镜通过将音频转换成字幕来帮助那些听力受损的人与他人进行对话,而这些字幕会出现在眼镜的屏幕上,”我们一直在与Microsoft HoloLens进行合作,它是一款AR产品,员工们可以使用它快速解决复杂的任务,并相互之间能够随时随地进行协作。我们思考并研究了AR是如何帮助人们,以及如何将我们在电视上阅读的字幕融入日常生活的现实。” XRAI Glass的联合创始人米切尔·费尔德曼(Mitchell Feldman)说道,”我们首先在团队中的一个聋哑人身上测试了XRAI Glass眼镜,当她使用之后喜极而泣时,我们意识到我们正在做一些了不起的东西。”

与眼镜配套使用的软件还可以实时翻译阿拉伯语等多种语言,并将结果传送到镜片上,”这款软件可以将所有的语音实时转换成字幕,彻底改变了那些有需要的人们的生活。这款智能眼镜将帮助那些听力受损的人进行对话,将音频转换成字幕,然后显示在眼镜屏幕上。数百万想要努力记住对话内容细节的人也会受益,无论他们是记忆力受损还是很难集中注意力,通常是与日常生活的节奏有关。费尔德曼说:”由于语音识别能力的强大,这些眼镜甚至可以识别说话者是谁。”

公司将沙特阿拉伯作为进入中东市场的切入点,该国的听障者肯定会从这一出色的技术中受益。由于沙特存在很多患有注意力缺陷多动障碍(ADHD)的儿童,加上该国有庞大的聋人群体,XRAI Glass看到了市场的巨大潜力,”我们认为沙特是中东地区此项技术的重要使用者,同时是帮助企业和民众的先锋,正如我在LEAP展会上看到的那样,这是一个充满人文关怀的国度,XRAI Glass进入中东市场是自然而然的事情。”费尔德曼说道。

根据世界卫生组织的数据,沙特阿拉伯的聋人群体人数超过72万人,是阿拉伯世界中最高的,而且沙特有15%的儿童被诊断患有多动症,相比之下,美国的统计数据表明该国有10%的儿童患有多动症。这样看来,XRAI Glass技术的市场似乎很大,因为该技术正是帮助那些听力受损的人以及那些难以专注听力的人。

“音频转字幕并不是什么新鲜事,很多应用程序都有这个功能,但XRAI Glass软件能够读懂人们的面部表情并把它变成对话的一部分,这真正了改变人们的生活方式。在一般的应用软件使用中,普遍存在的一个问题是,当人们通过应用程序阅读字幕时,是在手机上阅读,这意味着他们会低头看手机,因此无法看见谈话对方的身体动作、面部表情等构成对话的要素。但XRAI Glass软件通过能够在“眼前”阅读字幕,让你在交谈中更加全神贯注。XRAI眼镜还可以记录对话,将它们存储以便以后回忆,这在学习环境中非常有用,而且也能帮助那些记性不好又想要记录信息的人,比如那些患有多动症或音频处理障碍的人,他们的听力和视力都很好,但他们无法通过听觉处理信息,只有通过阅读才能,所以对于这些人来说非常有用,” 费尔德曼说道。

除了音频转换到字幕的功能,XRAI Glass还将推出个人AI的试点项目。利用ChatGPT的AI助手,是一款备受全球关注的人工智能文本生成程序。据费尔德曼称,用户可以对这款AI助手提问,即使是复杂的问题它也能够回答,且答案会立即显示在镜片上:费尔德曼声称该系统比现有的语音助手更强大,并特别强调了它对学生的潜在价值,”使用ChatGPT意味着你可以获得深入的信息。ChatGPT是一个聊天机器人,是一个语言模型,可以帮助用户根据需要获取问题的答案和信息,然后通过眼镜以文本的形式显示在他们眼前,”他说。

XRAI Glass所展现的可能性是不可思议的,无论是在医疗保健领域改善听力障碍者和多动症患者的生活,还是在AI助手方面取得的进步。尽管在医疗保健方面毫无疑问会帮助到有需要的人,但眼镜通过AI助手即时显示信息并立即呈现的能力也许会改变我们搜索信息和与信息互动的方式。【全文完】


来源:《连线》2023春刊 | 作者:Nadine Kahil
原文标题: