一种虚拟现实设备中声场的处理方法及装置-复审决定


发明创造名称:一种虚拟现实设备中声场的处理方法及装置
外观设计名称:
决定号:201857
决定日:2020-01-21
委内编号:1F290332
优先权日:
申请(专利)号:201610538406.4
申请日:2016-07-08
复审请求人:北京时代拓灵科技有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王兴
合议组组长:孙方涛
参审员:于晓溪
国际分类号:H04R3/00(2006.01)
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案相对于作为最接近现有技术的对比文件公开的技术方案存在区别特征,上述区别特征的一部分被其他对比文件公开或者属于本领域的惯用手段,该区别特征的其余部分既未被其他对比文件公开,也不属于本领域公知常识,同时上述区别特征的其余部分使该权利要求的技术方案获得了有益的技术效果,则该权利要求具备创造性。
全文:
本复审请求涉及申请号为201610538406.4,名称为“一种虚拟现实设备中声场的处理方法及装置”的发明专利申请(下称“本申请”)。申请人为北京时代拓灵科技有限公司。本申请的申请日为2016年07月08日,公开日为2016年09月21日。
经实质审查,国家知识产权局实质审查部门于2019年05月05日发出驳回决定,以权利要求1-8不具备创造性为由驳回了本申请。驳回决定所针对的文本为:申请日2016年07月08日提交的说明书第1-10页、说明书附图第1-5页、说明书摘要、摘要附图;2019年01月24日提交的权利要求第1-8项。驳回决定中引用了3篇对比文件,即:对比文件1:《中国博士学位论文全文数据库 信息科技辑》2010年第09期,“多通道语音信号处理中的关键技术研究——声场重构与语音分离”,汪林,大连理工大学,20100915,公开日为2010年09月15日;对比文件2:CN 103563401A,公开日为2014年02月05日;对比文件3:《华南理工大学学报》第41卷第8期,“HRTF空间插值与多通路声重放的稳定性分析”刘阳,谢菠荪,公开日为2013年08月31日。驳回决定的具体理由是:(1)权利要求1请求保护一种虚拟现实设备中声场的处理方法,其与对比文件1的区别特征为:预设数量的双耳信号中还包括第二预设数量的超采样双耳信号;对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;根据第一超采样双耳信号和第二超采样双耳信号计算当前双耳信号;其中,按照下述公式对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号:,其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双儿信号、第i个采样双耳信号对应的拟合系数;另外,所述处理方法还利用双耳信号的对称性来降低需要处理的数据量,通过交换左右耳的信号来实现左右相反的双耳信号,利用延时低通滤波器来实现前后相反的双耳信号。上述区别特征的一部分已被对比文件2公开,其余部分是本领域的惯用手段,因此权利要求1相对于对比文件1、对比文件2及本领域的惯用手段的结合不具备专利法第22条第3款规定的创造性。(2)权利要求2的附加特征被对比文件2公开;权利要求3、4的附加特征一部分被对比文件2公开,其余是本领域的惯用手段;权利要求5的附加特征一部分被对比文件3公开,其余在对比文件2的基础上是本领域的惯用手段;权利要求6的附加特征被对比文件3公开;因此从属权利要求2-6不具备专利法第22条第3款规定的创造性。(3)权利要求7请求保护一种虚拟现实设备中声场的处理装置,其与对比文件1的区别特征为:预设数量的双耳信号中还包括第二预设数量的超采样双耳信号;对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;根据第一超采样双耳信号和第二超采样双耳信号计算当前双耳信号;其中,按照下述公式对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号:,其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双耳信号、第i个采样双耳信号对应的拟合系数;处理装置包括:双耳信号分布单元、拟合单元、双耳信号确定单元、插值单元。上述区别特征的一部分已被对比文件2公开,其余部分是本领域的惯用手段,因此权利要求7相对于对比文件1、对比文件2及本领域的惯用手段的结合不具备专利法第22条第3款规定的创造性。(4)权利要求8的附加特征与权利要求5对应,基于相同的理由,从属权利要求8不具备专利法第22条第3款规定的创造性。驳回决定所针对的权利要求书的内容如下:
“1. 一种虚拟现实设备中声场的处理方法,其特征在于,所述处理方法包括:
预先确定预设数量的双耳信号,所述预设数量的双耳信号在以用户头部为中心的各个方向上分布,所述预设数量的双耳信号中包括第一预设数量的采样双耳信号和第二预设数量的超采样双耳信号;
对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;
根据用户头部转动的水平角度,确定与所述水平角度最接近的第一超采样双耳信号和第二超采样双耳信号;
对所述第一超采样双耳信号以及所述第二超采样双耳信号进行插值,确定线性插值系数,得到与所述水平角度相对应的当前双耳信号,并向用户播放所述当前双耳信号;
其中,按照下述公式对所述第一预设数量的采样双耳信号进行拟合,
得到所述第二预设数量的超采样双耳信号:

其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双儿信号、第i个采样双耳信号对应的拟合系数;
另外,所述处理方法还利用双耳信号的对称性来降低需要处理的数据量,通过交换左右耳的信号来实现左右相反的双耳信号,利用延时低通滤波器来实现前后相反的双耳信号。
2. 根据权利要求1所述的处理方法,其特征在于,所述预设数量的双耳信号在以用户头部为中心的各个方向上等间隔分布。
3. 根据权利要求1所述的处理方法,其特征在于,所述预设数 量的双耳信号在用户头部正面的分布数量大于在用户头部背面的分布数量。
4. 根据权利要求1所述的处理方法,其特征在于,在得到所述第二预设数量的超采样双耳信号之后,所述方法还包括:将所述第一预设数量的采样双耳信号以及各个拟合系数存储至虚拟现实设备中。
5. 根据权利要求1所述的处理方法,其特征在于,对所述第一超采样双耳信号以及所述第二超采样双耳信号进行插值,得到与所述水平角度相对应的当前双耳信号具体包括:
根据所述水平角度、所述第一超采样双耳信号对应的第一角度以及所述第二超采样双耳信号对应的第二角度,确定线性插值系数;基于所述线性插值系数、所述第一超采样双耳信号以及所述第二超采样双耳信号,确定与所述水平角度相对应的当前双耳信号。
6. 根据权利要求1所述的处理方法,其特征在于,按照下述公式确定线性插值系数:

其中,g表示所述线性插值系数,θ为所述水平角度,θ1为所述第一角度,θ2为所述第二角度;
按照下述公式确定与所述水平角度相对应的当前双耳信号:
Bp=(1-g)·V1 g·V2
其中,Bp为所述当前双耳信号,V1为所述第一超采样双耳信号,V2为所述第二超采样双耳信号。
7. 一种虚拟现实设备中声场的处理装置,其特征在于,所述处理装置包括:
双耳信号分布单元,用于预先确定预设数量的双耳信号,所述预设数量的双耳信号在以用户头部为中心的各个方向上分布,所述预设数量的双耳信号中包括第一预设数量的采样双耳信号和第二预设数量的超采样双耳信号;
拟合单元,用于对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;
双耳信号确定单元,用于根据用户头部转动的水平角度,确定与所述水平角度最接近的第一超采样双耳信号和第二超采样双耳信号;
插值单元,用于对所述第一超采样双耳信号以及所述第二超采样双耳信号进行插值,得到与所述水平角度相对应的当前双耳信号,并向用户播放所述当前双耳信号;
其中,所述拟合单元按照下述公式对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号:

其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双儿信号、第i个采样双耳信号对应的拟合系数。
8. 根据权利要求7所述的处理装置,其特征在于,所述插值单元具体包括:
插值系数确定模块,用于根据所述水平角度、所述第一超采样双耳信号对应的第一角度以及所述第二超采样双耳信号对应的第二角度,确定线性插值系数;
当前双耳信号确定模块,用于基于所述线性插值系数、所述第一超采样双耳信号以及所述第二超采样双耳信号,确定与所述水平角度相对应的当前双耳信号。”
申请人(下称“复审请求人”)对上述驳回决定不服,于2019年07月05日向国家知识产权局提出了复审请求,提出复审请求时没有对申请文件作出修改。复审请求人认为:对比文件2没有给出减少双耳信号计算量的启示。首先,从对比文件2中不能直接地、毫无疑义地得出,根据对比文件2的记载,空圆的HRTF是由其相邻的两个填充圆的HRTF确定得到的,在确定空圆的HRTF时并没有考虑其他填充圆的HRTF,其实际过程中并没有预先计算及存储其他填充圆的对应系数(即α、β值)。而本申请中,每一个超采样双耳信号都是由同样的第一预设数量的采样双耳信号确定的,也就是说,在确定每一个超采样双耳信号的过程中考虑到了每一个采样双耳信号,其具体采用的方式与对比文件2不同,其实际过程中需要预先计算和存储针对每一个超采样双耳信号、每一个采样双耳信号对应的拟合系数,即:能够保证其准确度,具有较好的双耳音效。对比文件2中仅通过相邻的两个采样信号拟合超采样信号,以此种拟合方式可以减少计算量,但是精度不够,而通过所有采样信号拟合超采样信号的方式计算量很大,但是精度高,此缺点正是本申请要解决的问题:本申请实际过程中需要预先计算和存储针对每一个超采样双耳信号、每一个采样双耳信号对应的拟合系数,此方法能够保证准确度,具有较好的双耳音效。本申请只需要对采样双耳信号进行处理,而采样双耳信号的数量往往较少,因此需要处理的数据量也往往较小,从而减少了需要处理的数据量,提高了双耳信号处理的效率。因此权利要求1-8具有创造性。
经形式审查合格,国家知识产权局于2019年07月12日依法受理了该复审请求,并将其转送至实质审查部门进行前置审查。
实质审查部门在前置审查意见书中认为:驳回决定中并未认为对比文件2能直接地、毫无疑义地得出,而是认为对比文件2中仅通过相邻的两个采样信号拟合超采样信号,而本申请中通过所有采样信号拟合超采样信号。然而,本领域技术人员熟知通过相邻的两个采样信号拟合超采样信号,此种拟合方式可以减少计算量,但是精度不够高,而通过所有采样信号拟合超采样信号的方式计算量大,但精度高,选择何种拟合方式是本领域技术人员可以根据用户对计算量和精度的需求而任意选择的。此外,权利要求1中并未记载“预先计算和存储针对每一个超采样双耳信号、每一个采样双耳信号对应的拟合系数”,即使将上述特征加入权利要求1,权利要求1也不具备创造性,因为对比文件2公开了:“在图7中,填充/着色圆表示用户装置204已经在HRTF数据库402中存储了HRTF的声源位置。空圆表示用户装置204不需要存储HRTF的声源位置。可以预先计算或选择α和β,以使α/β=θ/η。α和β可以针对不同圆/位置而不同”,因此对比文件2公开了存储采样双耳信号以及预先计算拟合系数,为了方便使用拟合系数,将预先计算好的拟合系数也存储起来是本领域的常用技术手段。本申请的背景技术以及解决的技术问题并未探讨在拟合的过程中,使用的数据的多少和计算量以及拟合效果的关系。本申请背景技术是:获取多个方向的双耳信号,通过多个方向的双耳信号插值得到头部在任何旋转角度时的双耳信号,但如果得到的双耳信号的方向较少,即N较小时,插值的精度是较低的,从而使得插值得到的双耳信号的音效较差。反之,如果为了保证插值精度,则需要在较多的方向得到双耳信号,那么这样的话需要处理的数据量又太大,无法保证插值得到双耳信号的效率。而为了解决上述问题,本申请获取第一预设数量的采样双耳信号,对第一预设数量的采样双耳信号进行拟合得到所述第二预设数量的超采样双耳信号,只需要对采样双耳信号进行处理,而采样双耳信号的数量往往较少,因此需要处理的数据量也往往较小,从而减少了需要处理的数据量,提高了双耳信号处理的效率。对比文件2也仅需要获取实心圆处的HRTF,空圆HRTF由其相邻的两个填充圆的HRTF确定得到,因此对比文件2也只需要对实心圆处的HRTF进行处理,数据量较少,提高了处理的效率。因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出复审请求审查决定。
二、决定的理由
(一)审查文本的认定
本复审请求审查决定针对的审查文本为:申请日2016年07月08日提交的说明书第1-10页、说明书附图第1-5页、说明书摘要、摘要附图;2019年01月24日提交的权利要求第1-8项。
(二)关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
本复审请求审查决定引用的对比文件与驳回决定引用的对比文件相同,即:
对比文件1:《中国博士学位论文全文数据库 信息科技辑》2010年第09期,“多通道语音信号处理中的关键技术研究——声场重构与语音分离”,汪林,大连理工大学,公开日为2010年09月15日;
对比文件2:CN 103563401A,公开日为2014年02月05日;
对比文件3:《华南理工大学学报》第41卷第8期,“HRTF空间插值与多通路声重放的稳定性分析”刘阳,谢菠荪,公开日为2013年08月31日。
1. 独立权利要求1请求保护一种虚拟现实设备中声场的处理方法,对比文件1公开了多通道语音信号处理方法,并具体公开了以下技术特征(参见对比文件1的正文第1章、第5章):三维声场重建,也称三维音频、虚拟声、双耳音频、空间声等,它根据人耳对声音信号的感知特点,使用信号处理方法对到达两耳的声信号进行模拟,以重建复杂三维虚拟空间声场;三维音频技术具有结构简单、易于实现、重建听觉空间真实自然的优点,因此在多媒体、虚拟现实(相当于一种虚拟现实设备中声场的处理方法)、人机交互、消费电子、心理声学等领域有着广泛的应用前景;但是,为了保证逼真的空间声音效果,虚拟声场重建通常需要巨大的计算量,这是制约三维音频技术发展的瓶颈问题。头相关传递函数HRTF描述了从声源到人耳的声音传递特性,它包含了声音定位的主要信息,对三维音频系统有着重要意义;HRTF通常在特定的声学环境下由精确的声学测量得到,然而,测量过程过于繁琐冗长,且仅能获得有限离散位置的HRTF数据(隐含公开了预先确定预设数量的双耳信号,所述预设数量的双耳信号中包括第一预设数量的采样双耳信号);图1.4公开了HRTF测量时各扬声器位于用户头部为中心的各个方向上(相当于所述预设数量的双耳信号在以用户头部为中心的各个方向上分布)。在处理头部或声源移动问题时,需要对有限个已测量HRTF进行插值,以得到任意方位的HRTF;线性插值法是最简单直接的插值方法,在线性插值法中,目标位置HRTF幅度由相邻位置HRTF幅度的加权组合得到,即 ,其中为目标HRTF幅度,和分别为相邻位置的HRTF幅度,r为与位置相关的比例因子(相当于根据用户头部转动的水平角度,确定与所述水平角度最接近的第一采样双耳信号和第二采样双耳信号;对所述第一采样双耳信号以及所述第二采样双耳信号进行插值,确定线性插值系数,得到与所述水平角度相对应的当前双耳信号)。三维音频实现可以分为两步进行:双耳声合成和双耳声重现;双耳声重现是指将合成的双耳声传递到人耳的过程,该过程必须保证两耳只能接收到各自声道的信号;双耳声重现有两种方法,一种是通过耳机,双耳声信号直接从耳机播放到人耳(相当于向用户播放所述当前双耳信号),不需要任何处理。
权利要求1请求保护的技术方案与对比文件1公开的内容相比,区别特征是:(1)预设数量的双耳信号中还包括第二预设数量的超采样双耳信号;对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;根据用户头部转动的水平角度确定的是第一超采样双耳信号和第二超采样双耳信号;进行插值的是第一超采样双耳信号和第二超采样双耳信号;其中,按照下述公式对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号:,其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双儿信号、第i个采样双耳信号对应的拟合系数;(2)所述处理方法还利用双耳信号的对称性来降低需要处理的数据量,通过交换左右耳的信号来实现左右相反的双耳信号,利用延时低通滤波器来实现前后相反的双耳信号。由此可以确定权利要求1所要求保护的技术方案实际解决的技术问题是:如何减少需要处理的数据量的同时保证插值精度。
对于上述区别特征(2),对比文件2公开了一种减少头部相关传递函数数据量的方法及系统,并具体公开了(参见对比文件2的说明书第[0099]-[0103]段):在一些实现中,用户装置204可以基于声学环境的对称性来存储较少的HRTF。例如,在图7中,假定位于用户102的头部右侧的圆的位置与位于用户102的头部左侧的圆是对称的。在这种情况下,可能仅需要存储用户102的头部右侧的HRTF。如果位于用户102的头部右侧的HRTF用HR(f)指示,而镜像HRTF用HL(f)指示,则HR(f)和HL(f)可以表达为表达式(11):HR(f)=HRL(f)l HRR(f)r;HL(f)=HLL(f)l HLR(f)r;由于对称性,HLL(f)=HRR(f)且HLR(f)=HRL(f);换句话说,HR(f)是HL(f)的转置矩阵。这可以表达为:HL(f)=HR(f)T(相当于所述处理方法还利用双耳信号的对称性来降低需要处理的数据量,通过交换左右耳的信号来实现左右相反的双耳信号)。且上述特征在对比文件2中的作用和其在权利要求1中作用相同,都是根据信号对称性降低所需处理的数据量,因此对比文件2给出了将上述特征用于对比文件1以解决其技术问题的启示。在此基础上,根据前后信号固有的关系,利用延时低通滤波器来实现前后相反的双耳信号是本领域的惯用手段。
对于上述区别特征(1),本申请在其背景技术中记载了现有技术中存在“通过N个方向的HRTF或BRIR滤波器滤波,得到N个方向的双耳信号。同样地,然后可以对其它方向的双耳信号进行插值,从而得到头部在任何旋转角度时的双耳信号”(参见本申请说明书第[0003]段),并提出现有技术存在“如果得到的双耳信号的方向较少,即N较小时,插值的精度是较低的,从而使得插值得到的双耳信号的音效较差。反之,如果为了保证插值精度,则需要在较多的方向得到双耳信号,那么这样的话需要处理的数据量又太大,无法保证插值得到双耳信号的效率”的技术问题。为此,上述区别特征(1)通过公式拟合得到超采样双耳信号,保证了超采样双耳信号的精度,相当于在较多的方向得到相对准确的双耳信号的同时又减少了需要存储和处理的数据量,接着进一步根据超采样双耳信号插值得到的双耳信号,从而保证了插值精度,改善了音效。由对比文件1公开的上述内容可知,对比文件1仅公开了对有限个已测量HRTF进行线性插值以得到任意方位的HRTF。对比文件2公开了一种减少头部相关传递函数数据量的方法及系统,并具体公开了以下技术特征(参见对比文件2的说明书第[0041]-[0043]、[0074]-[0116]段,附图7、11):图1C例示了按3D空间中的不同方向存储针对指定源的HRTF。如图所示,源可以位于环绕用户102的64个圆中的任一个处;在图1C中,为了使用户装置204仿真来自64个圆中的任一个处的声源的声音,用户装置204需要存储与这64个圆相关联的每一个HRTF;因为每一个HRTF都包括左耳HRTF和右耳HRTF,并且右耳/左耳HRTF都包括一组数字(例如,频率响应),所以用户装置204可能需要存储大量数据来表示所有HRTF;如下所述,声学系统或装置(例如,装置204)可以实现强度遥摄,以估计HRTF,这允许该系统使用很少的存储HRTF,并由此减少HRTF所需的存储空间量,根据该实现,该声学系统可以使用附加技术来减少存储HRTF的数量。图7例示了根据一个实现的强度遥摄,强度遥摄能够减少需要在用户装置204处存储的HRTF数据的量,在图7中,填充/着色圆表示用户装置204已经在HRTF数据库402中存储了HRTF的声源位置(相当于第一预设数量的采样双耳信号),空圆表示用户装置204不需要存储HRTF的声源位置(相当于第二预设数量的超采样双耳信号)。在该实现中,通过加权与邻近填充圆相关联的HRTF来构造针对特定位置处的声源的HRTF,例如,在图7中,假定用户装置204要确定圆704处的HRTF HEM(f)或HRTF的值(例如,该HRTF在特定频率下的值),HEM(f)可以表达为表达式(1):HEM(f)=HEML(f)l HEMR(f)r,其中,HEML(f)和HEMR(f)表示HEM(f)的左耳分量和右耳分量。r和l表示针对右耳和左耳矢量空间的正交单位基本矢量。 类似的是,可以将与邻近圆702和706相关联的HRTF表达为表达式(2):HA(f)=HAL(f)l HAR(f)r和表达式(3):HB(f)=HBL(f)l HBR(f)r;在该实现中,通过“遥摄”邻近HRTF HA(f)和HB(f)的强度作为它们相对于用户102的头部中心的方向(即,角度)的函数来获得期望HRTF。即表达式(4):HEM(f)≈αHA(f) βHB(f);假定θ表示由点702、用户102的头部中心以及点704形成的角,假定η表示由点704、用户102的头部中心以及点706形成的角;于是,可以预先计算或选择α和β,以使α/β=θ/η。α和β可以针对不同圆/位置而不同。利用(1)、(2)及(3),可以重写表达式(4)为表达式(5):HEM(f)≈α(HAL(f)l HAR(f)r) β(HBL(f)l HBR(f)r) =(αHAL(f) βHBL(f))l (αHAR(f) βHBR(f))r(相当于对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号);经由该强度遥摄,可以根据表达式(4)和/或(5)来确定针对图7中的任一空圆(或两个圆之间的任何点)的HRTF;因此,用户装置204不需要存储图7中的空圆的HRTF的值,用户装置204仅需要存储与经由强度遥摄获得HRTF所需一样多的HRTF,在上文中,尽管表达式(4)和(5)将HEM(f)示出为HA(f)和HB(f)的加权和,但在其它实现中,可以经由HA(f)和HB(f)的更复杂函数(例如,有理函数、多项式等)来计算或确定HEM(f)。在用户装置204或另一装置基于所存储的HRTF来确定所估计的HRTF之后(例如,参见图11中的框1120),用户装置204接着可以将所得的估计HRTF应用至音频信号,以生成输出信号。例如,假定X(f)是音频信号,Y(f)是输出信号,而HT(f)是所估计的HRTF,其中,HT(f)根据下列表达式(11)来确定:HT(f)=αHA(f) βHB(f)。接着,用户装置204根据以下表达式(12)来确定输出信号Y(f):Y(f)=X(f)HT(f)。在一些实现中,所存储的HRTF可以首先应用至音频信号,以获得中间信号,并且该中间信号接着可以被用于生成输出信号。即,与根据表达式(12)确定Y(f)不同,用户装置204可以依靠以下表达式(14):Y(f)=αX(f)HA(f) βX(f)HB(f),即,在这些实现中,用户装置204可以首先估计αX(f)HA(f)和βX(f)HB(f),接着将所得估计值求和,以获得Y(f)。表达式(14)是通过将表达式(11)代入表达式(12)中而获得的。由对比文件2公开的全部内容可知,对比文件2仅公开了通过加权与邻近填充圆相关联的HRTF来构造针对特定位置处的声源的HRTF,其本质与对比文件1公开的线性插值相同,也只是对有限个已测量HRTF进行线性插值以得到任意方位的HRTF。对比文件3仅公开了一种HRTF空间插值与多通路声重放的稳定性分析方法,涉及根据水平角度、第一角度和第二角度在立体空间内,通过相邻方位的HRTF计算当前双耳信号(参见对比文件3的正文第1栏第1行-第3栏第7行)。由此可见,对比文件1-3均未考虑在对HRTF进行插值以得到双耳信号时存在本申请所要解决的技术问题,均未涉及通过所有第一预设数量的采样双耳信号进行拟合以得到较为精确的第二预设数量的超采样双耳信号,再通过对超采样双耳信号插值得到的双耳信号,因此没有公开区别特征(1),也没有给出采用区别特征(1)以减少需要处理的数据量的同时保证插值精度的技术启示,也没有任何证据能够证明区别特征(1)限定的插值得到的双耳信号的方式是本领域的惯用手段,且通过区别特征(1)可以减少需要处理的数据量的同时保证插值精度,以改善音效。因此,权利要求1请求保护的技术方案相对于对比文件1-3及本领域的惯用手段的结合具有突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
2. 从属权利要求2-6直接或间接引用权利要求1,当权利要求1具备创造性时,从属权利要求2-6也具备专利法第22条第3款规定的创造性。
3. 独立权利要求7请求保护一种虚拟现实设备中声场的处理装置,对比文件1公开了多通道语音信号处理方法,并具体公开了以下技术特征(参见对比文件1的正文第1章、第5章):三维声场重建,也称三维音频、虚拟声、双耳音频、空间声等,它根据人耳对声音信号的感知特点,使用信号处理方法对到达两耳的声信号进行模拟,以重建复杂三维虚拟空间声场;三维音频技术具有结构简单、易于实现、重建听觉空间真实自然的优点,因此在多媒体、虚拟现实(相当于一种虚拟现实设备中声场的处理装置)、人机交互、消费电子、心理声学等领域有着广泛的应用前景;但是,为了保证逼真的空间声音效果,虚拟声场重建通常需要巨大的计算量,这是制约三维音频技术发展的瓶颈问题。头相关传递函数HRTF描述了从声源到人耳的声音传递特性,它包含了声音定位的主要信息,对三维音频系统有着重要意义;HRTF通常在特定的声学环境下由精确的声学测量得到,然而,测量过程过于繁琐冗长,且仅能获得有限离散位置的HRTF数据(隐含公开了预先确定预设数量的双耳信号,所述预设数量的双耳信号中包括第一预设数量的采样双耳信号);图1.4公开了HRTF测量时各扬声器位于用户头部为中心的各个方向上(相当于所述预设数量的双耳信号在以用户头部为中心的各个方向上分布)。在处理头部或声源移动问题时,需要对有限个已测量HRTF进行插值,以得到任意方位的HRTF;线性插值法是最简单直接的插值方法,在线性插值法中,目标位置HRTF幅度由相邻位置HRTF幅度的加权组合得到,即 ,其中为目标HRTF幅度,和分别为相邻位置的HRTF幅度,r为与位置相关的比例因子(相当于根据用户头部转动的水平角度,确定与所述水平角度最接近的第一采样双耳信号和第二采样双耳信号;对所述第一采样双耳信号以及所述第二采样双耳信号进行插值,确定线性插值系数,得到与所述水平角度相对应的当前双耳信号)。三维音频实现可以分为两步进行:双耳声合成和双耳声重现;双耳声重现是指将合成的双耳声传递到人耳的过程,该过程必须保证两耳只能接收到各自声道的信号;双耳声重现有两种方法,一种是通过耳机,双耳声信号直接从耳机播放到人耳(相当于向用户播放所述当前双耳信号),不需要任何处理。
权利要求7请求保护的技术方案与对比文件1公开的内容相比,区别特征是:(1)预设数量的双耳信号中还包括第二预设数量的超采样双耳信号;对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号;根据用户头部转动的水平角度确定的是第一超采样双耳信号和第二超采样双耳信号;进行插值的是第一超采样双耳信号和第二超采样双耳信号;其中,按照下述公式对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号:,其中,Sj表示第j个超采样双耳信号,Bi为第i个采样双耳信号,N为所述第一预设数量,M为所述第二预设数量,Pj,i为针对第j个超采样双儿信号、第i个采样双耳信号对应的拟合系数;(2)处理装置包括:双耳信号分布单元、拟合单元、双耳信号确定单元、插值单元。由此可以确定权利要求7所要求保护的技术方案实际解决的技术问题是:如何减少需要处理的数据量的同时保证插值精度。
对于上述区别特征(2),通过功能模块实现对应的方法步骤是本领域的惯用手段。
对于上述区别特征(1),本申请在其背景技术中记载了现有技术中存在“通过N个方向的HRTF或BRIR滤波器滤波,得到N个方向的双耳信号。同样地,然后可以对其它方向的双耳信号进行插值,从而得到头部在任何旋转角度时的双耳信号”(参见本申请说明书第[0003]段),并提出现有技术存在“如果得到的双耳信号的方向较少,即N较小时,插值的精度是较低的,从而使得插值得到的双耳信号的音效较差。反之,如果为了保证插值精度,则需要在较多的方向得到双耳信号,那么这样的话需要处理的数据量又太大,无法保证插值得到双耳信号的效率”的技术问题。为此,上述区别特征(1)通过公式拟合得到超采样双耳信号,保证了超采样双耳信号的精度,相当于在较多的方向得到相对准确的双耳信号的同时又减少了需要存储和处理的数据量,接着进一步根据超采样双耳信号插值得到的双耳信号,从而保证了插值精度,改善了音效。由对比文件1公开的上述内容可知,对比文件1仅公开了对有限个已测量HRTF进行线性插值以得到任意方位的HRTF。对比文件2公开了一种减少头部相关传递函数数据量的方法及系统,并具体公开了以下技术特征(参见对比文件2的说明书第[0041]-[0043]、[0074]-[0116]段,附图7、11):图1C例示了按3D空间中的不同方向存储针对指定源的HRTF。如图所示,源可以位于环绕用户102的64个圆中的任一个处;在图1C中,为了使用户装置204仿真来自64个圆中的任一个处的声源的声音,用户装置204需要存储与这64个圆相关联的每一个HRTF;因为每一个HRTF都包括左耳HRTF和右耳HRTF,并且右耳/左耳HRTF都包括一组数字(例如,频率响应),所以用户装置204可能需要存储大量数据来表示所有HRTF;如下所述,声学系统或装置(例如,装置204)可以实现强度遥摄,以估计HRTF,这允许该系统使用很少的存储HRTF,并由此减少HRTF所需的存储空间量,根据该实现,该声学系统可以使用附加技术来减少存储HRTF的数量。图7例示了根据一个实现的强度遥摄,强度遥摄能够减少需要在用户装置204处存储的HRTF数据的量,在图7中,填充/着色圆表示用户装置204已经在HRTF数据库402中存储了HRTF的声源位置(相当于第一预设数量的采样双耳信号),空圆表示用户装置204不需要存储HRTF的声源位置(相当于第二预设数量的超采样双耳信号)。在该实现中,通过加权与邻近填充圆相关联的HRTF来构造针对特定位置处的声源的HRTF,例如,在图7中,假定用户装置204要确定圆704处的HRTF HEM(f)或HRTF的值(例如,该HRTF在特定频率下的值),HEM(f)可以表达为表达式(1):HEM(f)=HEML(f)l HEMR(f)r,其中,HEML(f)和HEMR(f)表示HEM(f)的左耳分量和右耳分量。r和l表示针对右耳和左耳矢量空间的正交单位基本矢量。 类似的是,可以将与邻近圆702和706相关联的HRTF表达为表达式(2):HA(f)=HAL(f)l HAR(f)r和表达式(3):HB(f)=HBL(f)l HBR(f)r;在该实现中,通过“遥摄”邻近HRTF HA(f)和HB(f)的强度作为它们相对于用户102的头部中心的方向(即,角度)的函数来获得期望HRTF。即表达式(4):HEM(f)≈αHA(f) βHB(f);假定θ表示由点702、用户102的头部中心以及点704形成的角,假定η表示由点704、用户102的头部中心以及点706形成的角;于是,可以预先计算或选择α和β,以使α/β=θ/η。α和β可以针对不同圆/位置而不同。利用(1)、(2)及(3),可以重写表达式(4)为表达式(5):HEM(f)≈α(HAL(f)l HAR(f)r) β(HBL(f)l HBR(f)r) =(αHAL(f) βHBL(f))l (αHAR(f) βHBR(f))r(相当于对所述第一预设数量的采样双耳信号进行拟合,得到所述第二预设数量的超采样双耳信号);经由该强度遥摄,可以根据表达式(4)和/或(5)来确定针对图7中的任一空圆(或两个圆之间的任何点)的HRTF;因此,用户装置204不需要存储图7中的空圆的HRTF的值,用户装置204仅需要存储与经由强度遥摄获得HRTF所需一样多的HRTF,在上文中,尽管表达式(4)和(5)将HEM(f)示出为HA(f)和HB(f)的加权和,但在其它实现中,可以经由HA(f)和HB(f)的更复杂函数(例如,有理函数、多项式等)来计算或确定HEM(f)。在用户装置204或另一装置基于所存储的HRTF来确定所估计的HRTF之后(例如,参见图11中的框1120),用户装置204接着可以将所得的估计HRTF应用至音频信号,以生成输出信号。例如,假定X(f)是音频信号,Y(f)是输出信号,而HT(f)是所估计的HRTF,其中,HT(f)根据下列表达式(11)来确定:HT(f)=αHA(f) βHB(f)。接着,用户装置204根据以下表达式(12)来确定输出信号Y(f):Y(f)=X(f)HT(f)。在一些实现中,所存储的HRTF可以首先应用至音频信号,以获得中间信号,并且该中间信号接着可以被用于生成输出信号。即,与根据表达式(12)确定Y(f)不同,用户装置204可以依靠以下表达式(14):Y(f)=αX(f)HA(f) βX(f)HB(f),即,在这些实现中,用户装置204可以首先估计αX(f)HA(f)和βX(f)HB(f),接着将所得估计值求和,以获得Y(f)。表达式(14)是通过将表达式(11)代入表达式(12)中而获得的。由对比文件2公开的全部内容可知,对比文件2仅公开了通过加权与邻近填充圆相关联的HRTF来构造针对特定位置处的声源的HRTF,其本质与对比文件1公开的线性插值相同,也只是对有限个已测量HRTF进行线性插值以得到任意方位的HRTF。对比文件3仅公开了一种HRTF空间插值与多通路声重放的稳定性分析方法,涉及根据水平角度、第一角度和第二角度在立体空间内,通过相邻方位的HRTF计算当前双耳信号(参见对比文件3的正文第1栏第1行-第3栏第7行)。由此可见,对比文件1-3均未考虑在对HRTF进行插值以得到双耳信号时存在本申请所要解决的技术问题,均未涉及通过所有第一预设数量的采样双耳信号进行拟合以得到较为精确的第二预设数量的超采样双耳信号,再通过对超采样双耳信号插值得到的双耳信号,因此没有公开区别特征(1),也没有给出采用区别特征(1)以减少需要处理的数据量的同时保证插值精度的技术启示,也没有任何证据能够证明区别特征(1)限定的插值得到的双耳信号的方式是本领域的惯用手段,且通过区别特征(1)可以减少需要处理的数据量的同时保证插值精度,以改善音效。因此,权利要求7请求保护的技术方案相对于对比文件1-3及本领域的惯用手段的结合具有突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
4. 从属权利要求8引用权利要求7,当权利要求7具备创造性时,从属权利要求8也具备专利法第22条第3款规定的创造性。
三、决定
撤销国家知识产权局于2019年05月05日对本申请作出的驳回决定。由国家知识产权局实质审查部门以下述文本为基础继续进行审批程序:
复审请求人于2019年01月24日提交的权利要求第1-8项;
复审请求人于申请日2016年07月08日提交的说明书第1-10页;
复审请求人于申请日2016年07月08日提交的说明书附图第1-5页;
复审请求人于申请日2016年07月08日提交的说明书摘要;
复审请求人于申请日2016年07月08日提交的摘要附图。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: