当前位置:首页  音频新闻  新闻资讯  音频技术音频正文

华为耳机专利 | 计算机视觉技术应用:智能感知周围环境

发布时间:07-13 编辑:华为

近日,华为申请了一项专利,其未来的音频耳机设备可能会集成全向摄像头,并使用人工智能来检测十字路口和快速靠近佩戴者的物体。

华为耳机专利 | 计算机视觉技术应用:智能感知周围环境

640 (86).png



华为在专利中表示计算机视觉技术,可以用于识别图像、跟踪运动和提取图像中数据,允许计算系统自动识别单个图片或视频帧中的对象,或识别一系列视频帧上的人类活动。通过应用场景理解、3D感知和手势识别等计算机视觉任务,该技术可以提升人工智能对现实世界的理解能力。


集成摄像头设计的耳机可用于模式识别、手势识别、商品和物体的3D识别、3D扫描和3D摄影。


此外,通过扩展用户的视野,华为耳机可以在户外播放音乐时,避免用户过于沉浸而无法听到周围的警示声音。该专利的另一个目的是必要时根据用户和环境的理解,反馈给用户,提高出行安全。


安装在耳套上的摄像机视野可能有限。因此,可以通过配置传感器来捕获图像,使捕获的图像不与另一个佩戴式电子设备捕获的另一个图像重叠,从而有效地捕获图像。


更具体地说,耳戴式电子设备可以通过在计算机视觉任务检测到附近汽车时提醒用户与用户进行交互,如华为专利图7所示。如图14(a)所示,全向摄像头#301′的视场和全向摄像头#302′的视场可能有一定的部分重叠。


 640 (62).jpg


另一种使用场景可能是智能步行和骑自行车。如图15所示,当计算机视觉任务检测到附近有汽车时,耳机可以通过提醒用户(例如,戴着耳机#100的骑自行车者)进行交互。如果附近的汽车被检测到并识别,第一个全向摄像头#301'和第二个全向摄像头#301′可能会提醒戴着耳机的骑自行车的人。


下面的图3描述了耳机的系统架构示例;如图13(b)所示,用户的视野与第一全向摄像头#301和第二全向摄像头#301′的视野可能没有重叠(取决于型号)。


 640 (63).jpg

除了检测接近耳机用户的危险之外,华为还提供了第二个用例场景,可以增强聆听体验。在图8中,用户能够在摄像机前使用手势来控制音乐播放。感兴趣的读者可以点击原文链接,查看专利20230209020。


声明:该文观点仅代表作者本人,音频应用发布平台仅提供信息存储空间服务。加微信:254969084带你进群学习!百家号免费发布

最新音频交流