科技| AI耳机打造“声音气泡” 隔绝几英尺外所有声音
[星岛综合报道]想像一下:你在办公室工作,戴着降噪耳机以减少周围的噪音。一位同事走到你的办公桌前,问了一个问题,而你不需要摘下耳机,也不会说“什么?”就能清楚听到问题。同时,远处的饮水机边聊天声依然被静音。或者,想像自己在一间嘈杂的餐厅,能清楚听到桌上每个人的谈话,但餐厅里其他的声音被减弱。
由华盛顿大学研究人员领导的团队开发了一款耳机原型,让使用者能创建这样的“声音气泡”。团队运用人工智能算法结合耳机原型,让佩戴者能清楚听到气泡内、半径3至6英尺内的人说话的声音,而气泡外的声音则被平均降低49分贝(约等于吸尘器声与树叶沙沙声之间的差异),即使气泡外的声音比气泡内的声音更大声也能如此。
团队于11月14日在《自然电子学》(Nature Electronics)上发表了研究成果,并将这款概念证明装置的代码公开,供其他人改进和应用。目前,研究人员正在创建一家初创公司以将这项技术商业化。
“在人类周围有多种声音来源的情况下,我们并不擅长通过声音感知距离,”华盛顿大学保罗·G·艾伦电脑科学与工程学院教授,也是此研究的资深作者Shyam Gollakota说。“在像嘈杂的餐厅这样的地方,我们专注于身边人的能力有限,所以在可穿戴设备上创建声音气泡以往是不可能的。我们的AI系统能实时学习房间内每个声源的距离,并在耳机装置本身内以8毫秒的速度进行处理。”
研究人员利用市面上的降噪耳机创建了原型,并在头带上附加了六个小型麦克风。团队的神经网络运行在耳机附带的小型嵌入式电脑上,负责追踪不同声音到达各个麦克风的时间差。系统会遏制来自气泡外的声音,同时回放并略微增强气泡内的声音(因为降噪耳机会物理性地允许一些声音通过)。
“我们曾在一个智能音箱系统中将麦克风分散在桌子上,因为我们认为需要麦克风之间有较大的距离来提取声音的距离信息,”Gollakota说,“但后来我们开始质疑这一假设。我们真的需要大的距离来创建这种‘声音气泡’吗?我们在这里证明,其实不需要。我们只使用耳机上的麦克风就能实现,而且是实时的,这相当令人惊讶。”
为了训练系统在不同环境中创建声音气泡,研究人员需要基于距离的声音数据集,而这样的数据集在现实中并不存在。为此,他们将耳机戴在假人头上,并将假人头固定在一个可旋转的机器人平台上,让一个移动的喇叭从不同距离播放声音。团队使用假人系统以及人类用户在22个不同的室内环境中(包括办公室和生活空间)收集了数据。
研究人员发现,系统能成功运作有以下几个原因。首先,佩戴者的头部会反射声音,这帮助神经网络区分不同距离的声音。其次,声音(如人类语音)具有多种频率,每种频率在从声源传播时经历不同的相位变化。研究人员认为,团队的AI算法正在比较这些频率的相位来判断声源的距离(例如说话的人)。
像苹果的AirPods Pro 2这样的耳机可以增强佩戴者面前说话者的声音,并减少一些背景噪音。但这些功能是通过追踪头部位置并增强来自特定方向的声音实现的,而不是基于距离测量。因此,这类耳机无法同时增强多个说话者的声音,且当佩戴者将头部转向目标说话者时功能会丢失,对减少来自该方向的大声音的效果也不如本系统。
目前该系统仅训练用于室内环境,因为在户外收集干净的训练音频更加困难。接下来,研究团队正致力于让技术能运用于助听器和降噪耳塞,这需要一种新的麦克风布置策略。
图片:Nature Electronics
T10
>>>星岛网WhatsApp爆料热线(416)6775679,爆料一经录用,薄酬致意。
>>>立即浏览【生活百答】栏目:新移民抵埗攻略,老华侨也未必知道的事,移民、工作、居住、食玩买、交通、报税、银行、福利、生育、教育。
