以色列公司 VocalZoom:脸一动就知道你在说什么

catkin
catkin
catkin
1325
文章
112
评论
2016-03-1023:37:12
评论
324 次浏览

仅凭人类说话时嘴巴、面部附近的皮肤震动频率便能得知他在说什么,这就是以色列公司VocalZoom的 HMC 光学人机交流传感器,它可以帮助语音识别技术做到更加精准。

通过将 VocalZoom HMC Sensor 集成到声控解决方案中,可以捕足、测量面部震动的数据,并将其转换为一个独立的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。

这是一个比硬币还小的多的 sensor,可能乍看起来没什么用——都能放置在人脸附近了,难道听不到他在说什么吗?直接用麦克风录音不就好了?

其实不然,拿人们熟知的 Siri 举例,在人声嘈杂的环境中它的识别准确率并不高,这都是噪音带来的影响。而 HMC Sensor 恰恰可以在人群之中通过激光探射某一用户的面部(用户并不会感知到,也没有健康危害),采集 0-1.5KHz 频率的人声信号。不过一般而言人声信号频率高达 8KHz,HMC Sensor 采集到的信号在人耳听来会比较模糊,只有经过训练的语音识别系统能够识别。所以 VocalZoom 也会配备一个能采集到 0-15KHz 频率的麦克风,配合 Sensor 一起使用,先采集正常的声音再提炼出想要的人声。

以色列公司 VocalZoom:脸一动就知道你在说什么

理论上来讲所有需要语音识别的设备都是它的应用场景。VocalZoom 公司的 VP Rammy Bahalul 告诉 36 氪,其已经谈成合作的厂商包括美国最大的汽车后视镜厂商之一、附带通讯功能的摩托头盔厂商、AR 眼镜厂商,但暂时还没有落地产品。

中国的语音识别技术厂商科大讯飞也已和 VocalZoom 达成合作,该公司表示,通过向用户耳机和汽车信息娱乐解决方案中加入 VocalZoom 传感器,科大讯飞的自动语音识别 (ASR) 功能可以平均得到 50%的改善,在打开车窗噪声明显的时候效果更加明显。其正在与科大讯飞共同研发一款耳机产品,而最先的合作方式将是把传感器与科大讯飞语音云结合。

Rammy Bahalul 表示,当 HMC Sensor 拿到足够多订单批量生产时,售价大概是不到 10 美金。

据他介绍,这项技术在大学实验室已经比较成熟,实际上军方早已有过应用,比如将激光发射到玻璃上采集震动频率来进行窃听。VocalZoom 从 2012年 开始研发更适合商用的 Sensor,可以做到激光的发射和接受都用同一个传感器实现,从而提及小到足够放进电子产品里,这一产品将在今年二季度正式上市。

该团队有 25 人,在 2010 时拿到 Iris Ventures 的 70 万美元 A 轮融资;2012年11月 拿到 3M New Ventures、OurCrowd、SilverFish 的 300 万美元 B 轮融资;2014年8月 拿到 Motorola Solutions 领投,3M New Ventures、OurCrowd、SilverFish、Radiant Venture Capital 跟投的 900 万美元 C 轮融资。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
catkin
  • 本文由 发表于 2016-03-1023:37:12
IDC:2021年中国政府行业数字化转型10大预测 高科技

IDC:2021年中国政府行业数字化转型10大预测

疫情对于全球经济的影响已经形成一种新的常态。政府的数字化转型对于疫情的防控、经济的复苏起到关键作用。中国政府的数字化转型正在向落实网络强国、数字中国、智慧社会战略的过程中稳步前行,在充分运用大数据、人...
数据作为新型生产要素的对比性分析 高科技

数据作为新型生产要素的对比性分析

     生产要素是不断演进的历史范畴,土地和劳动是农业经济时代重要的生产要素。 工业革命后,资本成为工业经济时代重要的生产要素,并且衍生出技术等生产要素。 随着数字经济时代的到来,数据作为生产要素的...
当信息时代遇上“量子” 高科技

当信息时代遇上“量子”

当中国制造变成中国创造,世界工厂将向世界高科技领域进军,并在自动化,信息化时代的跟随者向智能时代的引领者转变——吾等当奋进! 量子纠缠,不可改变,奇特关联特质在计算,通信带来质的改变与本质安全,更为重...