识别网络游戏中潜在高消费用户的方法及设备-复审决定


发明创造名称:识别网络游戏中潜在高消费用户的方法及设备
外观设计名称:
决定号:202137
决定日:2020-02-03
委内编号:1F272431
优先权日:
申请(专利)号:201710640317.5
申请日:2017-07-31
复审请求人:上海恺英网络科技有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:陈安安
合议组组长:杨洁
参审员:明媚
国际分类号:G06Q10/04,G06Q30/02
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,该区别技术特征属于本领域的公知常识,那么在最接近的现有技术的基础上结合本领域的公知常识而得到该权利要求的技术方案对于本领域技术人员来说是显而易见的,该权利要求不具有突出的实质性特点和显著的进步,不具备创造性。
全文:
本复审请求涉及申请号为201710640317.5,名称为“识别网络游戏中潜在高消费用户的方法及设备”的发明专利申请(下称本申请)。本申请的申请人为上海恺英网络科技有限公司,申请日为2017年07月31日,公开日为2018年02月13日。
经实质审查,国家知识产权局原审查部门于2018年10月18日发出驳回决定驳回了本申请,认为权利要求1-10不具备专利法第22条第3款规定的创造性,其理由是:权利要求1所要求保护的技术方案和对比文件1(CN106408325A,公开日为2017年02月15日)相比,区别技术特征为:(1)本申请对网络游戏中潜在的高消费用户进行识别,而对比文件1是对流失或不会流失的客户进行识别;(2)使用梯度提升树算法对所述样本用户的行为数据进行特征扩展,所述特征扩展包括根据所述样本用户的行为数据,使用梯度提升树算法生成多棵决策树;将所述的每一棵决策树的叶节点作为新的特征添加到所述样本用户的行为数据中;根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值。基于上述区别技术特征,本申请所实际解决的技术问题是如何选择预测对象以及如何提高特征扩展的效率。区别技术特征(1)属于本领域的公知常识;区别技术特征(2)部分被对比文件2(CN106095915A,公开日为2016年11月09日)公开,其它部分对本领域技术人来说是显而易见的,因此,在对比文件1的基础上结合对比文件2以及上述公知常识,得出该权利要求所要求保护的技术方案,对本领域技术人员来说是显而易见的。因此权利要求1不具备专利法第22条第3款所规定的创造性。从属权利要求2的附加技术特征部分被对比文件3(“基于改进的GBDT算法的乘客出行预测研究”,王天华,《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》,第2017年卷第03期,第C034-970页,公开日2017年03月15日)公开,部分为常规选择,因此,在对比文件1的基础上结合对比文件2-3以及本领域公知常识而得到权利要求2的技术方案对于本领域技术人员而言是显而易见的,权利要求2不具备专利法第22条第3款规定的创造性。权利要求3-5的附加技术特征被对比文件2或对比文件1公开,因此,在其引用的权利要求不具备创造性的情况下,权利要求3-5也不具备专利法第22条第3款规定的创造性。权利要求6-10请求保护一种识别网络游戏中潜在高消费用户的设备,其是与方法权利要求1-5对应的产品权利要求,因此,基于上述权利要求1-5的评述意见,权利要求6-10也不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:申请日2017年07月31日提交的说明书第[0001]-[0257]段、说明书附图图1-6、说明书摘要及摘要附图,2018年07月16日提交的权利要求1-10项。驳回决定所针对的权利要求书如下:
“1. 一种识别网络游戏中潜在高消费用户的方法,其中,该方法包括:
获取样本用户的行为数据,并对所述样本用户的行为数据进行特征提取与使用梯度提升树算法进行特征扩展,所述特征扩展包括根据所述样本用户的行为数据,使用梯度提升树算法生成多棵决策树;将所述的每一棵决策树的叶节点作为新的特征添加到所述样本用户的行为数据中;根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值;
基于提取和扩展特征后的行为数据,使用逻辑回归算法进行建模,获取用户为潜在高消费用户的预测模型;
获取预测用户的行为数据,对所述预测用户的行为数据进行特征扩展,并使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率。
2. 根据权利要求1所述的方法,其中,根据所述样本用户的行为数据,使用梯度提升树算法生成决策树,包括:
根据所述样本用户的行为数据生成决策树;
在未达到预设的迭代次数时,根据预设的损失函数和所述样本用户的行为数据对所述决策树进行更新。
3. 根据权利要求1所述的方法,其中,根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值,包括:
遍历所述决策树,将所述样本用户的行为数据归属到所述决策树的一个叶节点;
将所述样本用户的行为数据归属到的叶节点对应的新的特征进行置位,其它叶节点对应的新的特征进行复位。
4. 根据权利要求1或2所述的方法,其中,对所述预测用户的行为数据进行特征扩展,包括:
使用所述梯度提升树算法生成的决策树对所述预测用户的行为数据进行特征扩展。
5. 根据权利要求1所述的方法,其中,使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率之 后,还包括:
基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为潜在高消费用户。
6. 一种识别网络游戏中潜在高消费用户的设备,其中,该设备包括:
数据获取装置,用于获取样本用户的行为数据,并对所述样本用户的行为数据使用梯度提升树算法进行特征扩展,所述特征扩展包括根据所述样本用户的行为数据,使用梯度提升树算法生成多棵决策树;将所述的每一棵决策树的叶节点作为新的特征添加到所述样本用户的行为数据中;根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值;
建模装置,用于基于扩展特征后的行为数据,使用逻辑回归算法进行建模,获取用户为潜在高消费用户的预测模型;
预测装置,用于获取预测用户的行为数据,对所述预测用户的行为数据进行特征扩展,并使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率。
7. 根据权利要求6所述的设备,其中,所述决策树生成模块,用于:
根据所述样本用户的行为数据生成决策树;
在未达到预设的迭代次数时,根据预设的损失函数和所述样本用户的行为数据对所述决策树进行更新。
8. 根据权利要求6所述的设备,其中,所述特征赋值模块,用于:
遍历所述决策树,将所述样本用户的行为数据归属到所述决策树的一个叶节点;
将所述样本用户的行为数据归属到的叶节点对应的新的特征进行置位,其它叶节点对应的新的特征进行复位。
9. 根据权利要求6或7所述的设备,其中,所述预测装置,用于:
使用所述决策树生成模块生成的决策树,对所述预测用户的行为数据进行特征扩展。
10. 根据权利要求6所述的设备,其中,所述预测装置,还用于:
基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为潜在高消费用户。”
申请人(下称复审请求人)对上述驳回决定不服,于2019年01月28日向国家知识产权局提出了复审请求,但未修改申请文件。复审请求人认为:(1)虽然对比文件1也能实现用户行为数据的特征扩展,但是二者实现的方法不同,本申请是通过GBDT梯度提升树算法进行扩展的;(2)对比文件2中使用GBDT梯度提升树算法的目的在于实现身份转化,即将用户行为数据转化为身份特征向量,因此对比文件1中的用户行为数据无法和对比文件2中通过GBDT算法得到的身份特征向量结合到一起作为身份处理器的训练数据,即使将对比文件1和2结合,所得到的方案是将用户行为数据通过GBDT算法得到相应的身份特征向量,再将原有的用户行为数据丢弃,只将身份特征向量作为训练数据来建立身份处理模型,本申请中用于建立模型的训练数据是原有的用户行为数据和根据GBDT算法扩展得到的新的用户行为数据,二者为建模所获取的训练数据不同,并且,本申请中使用原始行为数据和根据GBDT算法扩展得到的新的用户行为数据,比只使用GBDT算法扩展特征后得到的特征数据作为训练数据得到的预测模型在准确率和召回率上会有较大提升。
经形式审查合格,国家知识产权局于2019年02月01日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:首先,对比文件1公开了对用户行为数据进行扩展,给出了对用户行为特征进行扩展的技术启示。而选择具体的特征扩展方法,即采用GBDT梯度提升树算法进行特征扩展的特征扩展方法被对比文件2公开。其次,根据本申请从属权利要求3的记载:遍历所述决策树,将所述样本数据归属到所述决策树的一个叶节点;将所述样本数据归属到的叶节点对应的新的特征进行置位,其它叶节点对应的新的特征进行复位。其中,置位指的是赋值“1”,复位指的是赋值“0”。由上述内容可知,本申请中所最终构建的决策树中叶节点,表示的并不是直接的未经处理的行为特征数据,而是经0-1特征赋值后的数据,这与对比文件2中经处理后的0-1身份特征向量在实质上并无区别;根据本申请说明书第[0243]段的记载:“数据获取装置对用户行为数据进行特征扩展通过决策树生成模块、特征添加模块和特征赋值模块的协作来完成”。也就是说本申请使用GBDT算法实现特征扩展,其实际上是对多棵决策树的构建,决策树的叶节点表示经置位/复位处理后的0-1行为特征数据,如果直接采用用户行为数据,而不经过特征赋值,则无法确定扩展后的特征数据。而对比文件2同样是使用GBDT算法构建多棵决策树,决策树的叶节点代表处理后的行为特征数据,因此对比文件2中使用GBDT算法的目的和本申请是相同的,均是为了解决单棵决策树存在的过拟合问题。再次,对比文件1公开了基于用户行为特征数据对用户类型进行预测,对用户行为特征数据进行扩展。对比文件2则公开了具体的特征扩展方法为使用GBDT算法构建多棵决策树,解决单棵决策树的过拟合问题。因此对比文件1和2具备结合启示。最后,由于对比文件2已经公开了使用GBDT算法获得的多棵决策树集合,而决策树叶节点输出的向量所代表的含义是对训练数据的判别规则,根据本申请说明书第[0157]段记载的内容:“决策树的叶节点代表一条判定规则,用于对样本用户的行为数据进行划分”可知,对比文件2所公开的使用GBDT算法获得的多棵决策树与本申请的多棵决策树所表示的含义和作用均是一致的。进而,在对比文件2公开了使用多棵决策树以及对决策树进行扩展的基础上,将扩展后的特征数据也添加到行为数据中,以使得将原始行为特征数据和通过GBDT算法扩展后得到的特征数据作为训练数据,实现对多棵决策树的进一步细化和更新,这是本领域的常规技术手段,属于公知常识。因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年08月30日向复审请求人发出复审通知书,指出:权利要求1与对比文件2的区别特征在于:(1)本申请是对网络游戏中潜在高消费用户的识别,而对比文件2是对设定身份用户的识别;(2)所述特征扩展包括将所述的每一颗决策树的叶节点作为新的特征添加到所述样本用户的行为数据中,并将扩展后的行为数据也用于建模和预测。基于上述区别特征,权利要求1所保护的解决方案所要解决的问题为:(1)所预测的具体身份的选择;(2)如何提高建模和预测的准确性。区别特征(1)是本领域技术人员的常规选择,属于本领域的公知常识。区别特征(2)是在对比文件2已经公开的内容和本领域惯用手段的基础上,本领域技术人员容易想到的。因此,在对比文件2的基础上结合本领域的公知常识而得到权利要求1的解决方案对于本领域技术人员而言是显而易见的,权利要求1不具备专利法第22条第3款规定的创造性。权利要求2的附加技术特征部分被对比文件2公开,部分被对比文件3公开,因此,在对比文件2的基础上结合对比文件3以及本领域公知常识得出权利要求2的技术方案对本领域技术人员来说是显而易见的,权利要求2不具备专利法第22条第3款所规定的创造性。权利要求3-4的附加技术特征被对比文件2公开,权利要求5的附加技术特征部分被对比文件2公开,部分为本领域的公知常识。因此,在其引用的权利要求不具备创造性的情况下,权利要求3-5也不具备专利法第22条第3款规定的创造性。权利要求6-10是与方法权利要求1-5对应的产品权利要求,因此,基于与上述权利要求1-5同样的评述意见,权利要求6-10也不具备专利法第22条第3款规定的创造性。
针对复审请求时提交的意见陈述,合议组回应如下:(1)对比文件2已经公开了使用GBDT算法进行行为数据的特征转换,该过程生成了多棵决策树,而每个决策树的叶节点在逻辑上均表示了某种用户可能的行为,因而将其作为新的特征用于扩充用户的行为数据是本领域技术人员容易想到的;(2)首先,根据本申请第[0159]段的记载:每个样本用户的行为数据从决策树的根节点开始进行遍历,直到到达该决策树的某个叶节点,则该行为数据归属于其到达的叶节点,并将该样本用户的行为数据中对应该叶节点的新特征的取值进行置位,该决策树中其它叶节点对应的新特征的取值进行复位,例如,置位可赋值为“1”,复位可赋值为“0”。由上述内容可知,本申请中所最终构建的决策树中叶节点,表示的并不是直接的未经处理的行为特征数据,而是经0-1特征赋值后的数据,这与对比文件2中经处理后的0-1身份特征向量实质上相同,均为一种行为数据的特征表达方式;其次,为了提高建模和测试的准确性,尽可能使其训练和测试数据更加丰富和全面,即扩充用于建模和测试的行为数据集是本领域的惯用手段;又因为对比文件2已经公开了使用用户的行为数据对GBDT模型进行训练,生成多棵决策树,在训练过程中涉及到根据行为数据将决策树的叶节点进行一一地赋值,可见每一个决策树的叶节点对应于某一种行为特征,在逻辑上可以认为是一种其它可能的行为数据,在此基础上,本领域技术人员容易想到将决策树的叶节点所代表的行为作为新的特征添加到用户行为数据中来补充训练和测试的数据集。
复审请求人于2019年10月12日提交了意见陈述书,并在独立权利要求1和6中均增加了技术特征“其中,获取样本用户的行为数据之后,还包括:对样本用户行为数据进行ETL处理操作,所述ETL处理操作包括如下一种或多种的组合:将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据”。复审请求人认为:权利要求1的技术方案与对比文件2相比,至少包括以下区别技术特征:获取样本用户的行为数据之后,还包括:对样本用户行为数据进行ETL处理操作,所述ETL处理操作包括如下一种或多种的组合:将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据。基于上述区别技术特征,权利要求1实际要解决的技术问题为:如何对用户行为数据进行正规化处理。本申请权利要求1的方案中,获得的用户行为数据需要进行正规化处理后再进行相应的特征扩展,正规化处理操作可以包括数据合并、数据去重、去除错误数据、解析编码后数据等,从而得到规范数据,避免不规范数据在模型训练过程中产生干扰,导致训练得到的模型不能很好地拟合用户行为数据。而根据对比文件2和对比文件1所公开的内容可知,对比文件2和对比文件1均未公开上述区别技术特征,也没有给出使用上述区别技术特征解决上述技术问题的技术启示。申请人认为,上述区别技术特征不是解决本申请要解决的技术问题的常用技术手段。
复审请求人在答复复审通知书时提交的权利要求书如下:
“1. 一种识别网络游戏中潜在高消费用户的方法,其中,该方法包括:
获取样本用户的行为数据,并对所述样本用户的行为数据进行特征提取与使用梯度提升树算法进行特征扩展,所述特征扩展包括根据所述样本用户的行为数据,使用梯度提升树算法生成多棵决策树;将所述的每一棵决策树的叶节点作为新的特征添加到所述样本用户的行为数据中;根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值;其中,获取样本用户的行为数据之后,还包括:对样本用户行为数据进行ETL处理操作,所述ETL处理操作包括如下一种或多种的组合:将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据;
基于提取和扩展特征后的行为数据,使用逻辑回归算法进行建模,获取用户为潜在高消费用户的预测模型;
获取预测用户的行为数据,对所述预测用户的行为数据进行特征扩展,并使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率。
2. 根据权利要求1所述的方法,其中,根据所述样本用户的行为数据,使用梯度提升树算法生成决策树,包括:
根据所述样本用户的行为数据生成决策树;
在未达到预设的迭代次数时,根据预设的损失函数和所述样本用户的行为数据对所述决策树进行更新。
3. 根据权利要求1所述的方法,其中,根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值,包括:
遍历所述决策树,将所述样本用户的行为数据归属到所述决策树的一个叶节点;
将所述样本用户的行为数据归属到的叶节点对应的新的特征进行置位,其它叶节点对应的新的特征进行复位。
4. 根据权利要求1或2所述的方法,其中,对所述预测用户的行为数据进行特征扩展,包括:
使用所述梯度提升树算法生成的决策树对所述预测用户的行为数据 进行特征扩展。
5. 根据权利要求1所述的方法,其中,使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率之后,还包括:
基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为潜在高消费用户。
6. 一种识别网络游戏中潜在高消费用户的设备,其中,该设备包括:
数据获取装置,用于获取样本用户的行为数据,并对所述样本用户的行为数据使用梯度提升树算法进行特征扩展,所述特征扩展包括根据所述样本用户的行为数据,使用梯度提升树算法生成多棵决策树;将所述的每一棵决策树的叶节点作为新的特征添加到所述样本用户的行为数据中;根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值;其中,获取样本用户的行为数据之后,还包括:对样本用户行为数据进行ETL处理操作,所述ETL处理操作包括如下一种或多种的组合:将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据;
建模装置,用于基于扩展特征后的行为数据,使用逻辑回归算法进行建模,获取用户为潜在高消费用户的预测模型;
预测装置,用于获取预测用户的行为数据,对所述预测用户的行为数据进行特征扩展,并使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为潜在高消费用户的概率。
7. 根据权利要求6所述的设备,其中,所述决策树生成模块,用于:
根据所述样本用户的行为数据生成决策树;
在未达到预设的迭代次数时,根据预设的损失函数和所述样本用户的行为数据对所述决策树进行更新。
8. 根据权利要求6所述的设备,其中,所述特征赋值模块,用于:
遍历所述决策树,将所述样本用户的行为数据归属到所述决策树的一个叶节点;
将所述样本用户的行为数据归属到的叶节点对应的新的特征进行置 位,其它叶节点对应的新的特征进行复位。
9. 根据权利要求6或7所述的设备,其中,所述预测装置,用于:
使用所述决策树生成模块生成的决策树,对所述预测用户的行为数据进行特征扩展。
10. 根据权利要求6所述的设备,其中,所述预测装置,还用于:
基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为潜在高消费用户。 ”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
审查文本的认定
复审请求人在2019年10月12日答复复审通知书时对权利要求书进行了修改,经审查,上述修改符合专利法第33条和专利法实施细则第61条第1款的规定。本复审决定所依据的文本是:复审请求人于2019年10月12日提交的权利要求第1-10项;申请日2017年07月31日提交的说明书第[0001]-[0257]段、说明书附图图1-6、说明书摘要及摘要附图。
专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。”
如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,该区别技术特征属于本领域的公知常识,那么在最接近的现有技术的基础上结合本领域的公知常识而得到该权利要求的技术方案对于本领域技术人员来说是显而易见的,该权利要求不具有突出的实质性特点和显著的进步,不具备创造性。
本复审决定所引用的对比文件与复审通知书所引用的对比文件相同, 为驳回决定中所引用的部分对比文件,即:
对比文件2:CN106095915A,公开日为2016年11月09日;
对比文件3:“基于改进的GBDT算法的乘客出行预测研究”,王天华,《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》,第2017年卷第03期,第C034-970页,公开日为2017年03月15日。
其中,对比文件2为最接近的现有技术。
(2.1)权利要求1不具备专利法第22条第3款规定的创造性
权利要求1要求保护一种识别网络游戏中潜在高消费用户的方法。对比文件2公开一种用户身份的处理方法,并具体公开了如下特征(参见说明书第[0021]-[0045]段):获取待处理用户的行为数据(相当于获取样本用户的行为数据);采用第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,训练预设的身份转化模型,得到身份转化器,本实施例的身份转化模型具体可以采用梯度提升决策树(GBDT)实现;根据身份转化器将待处理用户的行为数据转化为身份特征向量(相当于并对所述样本用户的行为数据进行特征提取与使用梯度提升树算法进行特征扩展);通过使用训练数据中的所有已知身份的行为数据对GBDT模型进行训练,最终得到N颗决策树(相当于根据所述样本用户的行为数据,使用梯度提升树算法生成多颗决策树);对N棵决策树中的每一棵树的叶节点都进行编号,例如第n棵决策树的第m个叶节点为(n,m),对每条训练数据,每颗树都会有一个叶节点输出该用户是设定身份用户的概率,如果概率大于指定阈值,可以将结果标记为1,否者为0(相当于根据所述样本用户的行为数据归属到所述决策树的叶节点的信息,为所述新的特征进行赋值);将第一行为数据集中的每一个设定身份用户行为数据和第二行为数据集中的每一个非设定设分用户的行为数据,分别输入至身份转化器中,得到第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量;采用第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量,训练预设的身份处理模型,得到身份处理器,例如,该预设的身份处理模型具体可以为逻辑回归模型(相当于基于提取特征后的行为数据,使用逻辑回归算法进行建模,获取用户身份的预测模型);根据身份处理器对待处理用户的身份特征向量进行处理,以确定待处理用户的身份是否为设定身份,其具体可以包括:根据身份处理器计算待处理用户的身份特征向量对应的待处理用户为设定身份的用户的概率值(相当于获取预测用户的行为数据,并使用所述预测模型对所述预测用户的行为数据进行预测,确定所述预测用户为设定身份的用户的概率);判断概率值是否大于或者等于预设概率阈值;若是,确定待处理用户为设定身份的用户;否则确定该待处理用户不是设定身份的用户(相当于基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为设定身份的用户)。
权利要求1与对比文件2的区别特征在于:(1)本申请是对网络游戏中潜在高消费用户的识别,而对比文件2是对设定身份用户的识别;(2)所述特征扩展包括将所述的每一颗决策树的叶节点作为新的特征添加到所述样本用户的行为数据中,并将扩展后的行为数据也用于建模和预测;(3)获取样本用户的行为数据之后,还包括:对样本用户行为数据进行ETL处理操作,所述ETL处理操作包括如下一种或多种的组合:将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据。基于上述区别特征,权利要求1所保护的解决方案所要解决的问题为:(1)所预测的具体身份的选择;(2)如何提高建模和预测的准确性;(3)如何提高数据规范性。
针对区别特征(1),网络游戏领域中的高消费用户是商家竞争重点客户群,因而存在提高对这类用户进行识别效率的需求,所以将对设定身份用户识别方法应用于该具体领域,对其进行识别是本领域技术人员的常规选择,属于本领域的公知常识。
针对区别特征(2),为了提高建模和测试的准确性,应尽可能使其训练和测试数据更加丰富和全面,因而扩充用于建模和测试的行为数据集是本领域的惯用手段;又因为对比文件2已经公开了使用用户的行为数据对GBDT模型进行训练,生成多棵决策树,在训练过程中涉及到根据行为数据将决策树的叶节点进行一一地赋值,可见每一个决策树的叶节点对应于某一种行为特征,在逻辑上可以认为是一种其它可能的行为数据,在此基础上,本领域技术人员容易想到将决策树的叶节点所代表的行为作为新的特征添加到用户行为数据中来补充训练和测试的数据集。
针对区别特征(3),对于获得的样本数据,进行合并、去重、过滤以及解析等常见的预处理手段,以提高处理数据的有效性和规范化程度,这是本领域常见数据预处理方式,选择其中的一种或几种进行处理均为本领域的常规选择,因而该区别特征(3)属于本领域的公知常识。
可见,在对比文件2的基础上结合本领域的公知常识而得到权利要求1的解决方案对于本领域技术人员而言是显而易见的。因此,权利要求1不具有突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
(2.2)权利要求2-5不具备专利法第22条第3款规定的创造性
权利要求2对权利要求1作了进一步限定,其附加特征限定了决策树更新的相关特征。对比文件2已经公开了(参见说明书第[0034]段):可以将第一行为数据集中包括的设定身份的用户的行为数据与第二行为数据集中包括的非设定身份的用户的行为数据,统称为训练数据,然后利用这些训练数据训练GBDT模型,可以分别获得N颗决策树(相当于根据所述样本用户的行为数据生成决策树);对比文件3公开一种基于改进的GBDT算法的乘客出行预测研究,公开了如下内容(参见对比文件3第1.2.1节):GBDT算法是用于解决回归和分类问题的机器学习方法,首先每个样本点在分类器上的取值作为后面训练模型的参数,然后采用梯度下降的方法来优化这些参数,从而最小化每个分类器的损失函数。其迭代的每次过程中都会使用决策树来拟合每个样本点的梯度。然后根据梯度信息建立决策树,最后建模时往梯度的负方向前进,最后迭代N次后,从而得到一组具有泛化能力的模型组合,从而组合成一个强的分类器,最终会得出一个精准的分类结果。可见,对比文件3公开了该权利要求2的附加特征“根据所述样本数据生成决策树,在未达到预设的迭代次数时,根据预设的损失函数和所述样本数据对所述决策树进行更新”,而且,该附加特征在对比文件3中所起的作用与在权利要求2中所起的作用相同,都是用于决策树更新。可见,在对比文件2的基础上结合对比文件3以及本领域公知常识得出权利要求2所要求保护的解决方案对本领域技术人员来说是显而易见的。因此,权利要求2所要求保护的解决方案不具备专利法第22条第3款所规定的创造性。
权利要求3对权利要求1作了进一步限定,对比文件2公开了如下内容(参见说明书第[0034]段):通过使用训练数据中的所有己知用户身份的行为数据对者GBDT模型进行训练,最终得到N颗决策树即为最终得到的身份转化器,该身份转化器可以根据行为数据对用户的身份进行识别,同时还可以根据识别结果生成唯一一个身份特征向量。例如,对于每一个用户的行为数据,该N颗树的叶子节点可以输出获得一个N*M向量,其中M为叶子节点数最多的决策树的叶子节点个数。如果第n颗树的第m个叶子节点判别训练数据的标记为1,则第((n-1)*M m)位元素为1,否者为0,不输出结果的叶节点对应的元素为0(相当于遍历所述决策树,将所述样本数据归属到所述决策树的一个叶节点;将所述样本数据归属到的叶节点对应的新的特征进行置位,其它叶节点对应的新的特征进行复位)。因此,在其引用的权利要求不具备创造性的基础上,权利要求3也不具备专利法第22条第3款所规定的创造性。
权利要求4对权利要求1或2作了进一步限定,其附加特征被对比文件2公开(参见说明书第[0034]段):通过使用训练数据中的所有已知用户身份的行为数据对者GBDT模型进行训练,最终得到N颗决策树即为最终得到的身份转化器,该身份转化器可以根据行为数据对用户的身份进行识别,同时还可以根据识别结果生成唯一一个身份特征向量。例如,对于每一个用户的行为数据,该N颗树的叶子节点可以输出获得一个N*M向量,其中M为叶子节点数最多的决策树的叶子节点个数。如果第n颗树的第m个叶子节点判别训练数据的标记为1,则第((n-1)*M m)位元素为1,否者为0,不输出结果的叶节点对应的元素为0(相当于使用所述梯度提升树算法生成的决策树对所述预测用户的行为数据进行特征扩展)。因此在其引用的权利要求不具备创造性的基础上,权利要求4也不具备专利法第22条第3款所规定的创造性。
权利要求5对权利要求1作了进一步限定。对比文件2还公开了如下内容(参见说明书第[0043]段):判断概率值是否大于或者等于预设概率阈值;若是,确定待处理用户为设定身份的用户(相当于基于预设阈值,将所述概率大于所述预设阈值的预测用户确定为设定身份的用户);否则确定该待处理用户的不是设定身份的用户。而本领域技术人员可以根据需要将该方法用于处理任何一种特定身份,例如潜在高消费用户,这是本领域技术人员的常规选择,属于本领域的公知常识。因此在其引用的权利要求不具备创造性的基础上,权利要求5也不具备专利法第22条第3款所规定的创造性。
(2.3)权利要求6-10不具备专利法第22条第3款规定的创造性。
权利要求6-10请求保护一种识别网络游戏中潜在高消费用户的设备,其是与方法权利要求1-5对应的产品权利要求,而且权利要求6-10所包含的特征分别与权利要求1-5所包含的特征相对应,并且采用对应一致的方式撰写。因此,基于与上述权利要求1-5同样的评述意见,权利要求6-10也不具备专利法第22条第3款所规定的创造性。
对复审请求人相关意见的评述
对于复审请求人所陈述的相关意见(参见案由部分),合议组认为:新增加的特征主要涉及对样本数据采取将多个来源的数据进行合并、去除重复的数据、过滤掉错误的数据、解析编码后的数据中的一种或多种处理方式,然而上述合并、去重、过滤、解析均为常见的数据预处理手段,在面临提高处理数据规范化程度的问题时,选择其中的一种或几种进行处理均为本领域的常规选择,属于本领域的公知常识。因此,修改后的权利要求1-10仍不具备专利法第22条第3款规定的创造性。

三、决定
维持国家知识产权局于2018年10月18日对本申请作出的驳回决定。
如对本复审决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本复审决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: