预测用户情感倾向的方法和设备-复审决定


发明创造名称:预测用户情感倾向的方法和设备
外观设计名称:
决定号:194719
决定日:2019-11-13
委内编号:1F274503
优先权日:
申请(专利)号:201410773604.X
申请日:2014-12-12
复审请求人:北京智谷睿拓技术服务有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:吴敏
合议组组长:刘浩然
参审员:甘文珍
国际分类号:G06F17/27
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,部分所述区别技术特征未被其他对比文件公开,也不属于本领域的公知常识,而且,所述部分区别技术特征能够为该项权利要求请求保护的技术方案带来有益的技术效果,则该项权利要求请求保护的技术方案相对于以上对比文件和本领域公知常识的结合具备创造性。
全文:
本复审请求涉及申请号为201410773604.X、名称为“预测用户情感倾向的方法和设备”的发明专利申请(下称本申请)。申请人为北京智谷睿拓技术服务有限公司。本申请的申请日为2014年12月12日,公开日为2015年04月08日。
经实质审查,国家知识产权局原审查部门于2018年11月05日发出驳回决定,驳回了本申请,其理由是:
1、独立权利要求1相对于对比文件1(CN103559233A,公开日为2014年02月05日)的区别技术特征在于:至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,是根据一用户情感随时间演变的模型确定的。对比文件3(CN102831184A,公开日为2012年12月19日)具有与对比文件1相结合的启示,使得本领域技术人员有动机采用先建立预测模型,再分析待评估文本的模式,实现情感预测,其中,概率运算属于本领域技术人员惯用的技术手段。因此,在对比文件1的基础上结合对比文件3以及本领域惯用技术手段得到权利要求1的技术方案是显而易见的,因此,权利要求1不具备专利法第22条第3款规定的创造性。2、权利要求2-5的附加技术特征或者被对比文件1公开,或者是本领域惯用技术手段,或者被对比文2(“基于特征提取和主题模型的文本分类研究”,项珑,《中国优秀硕士学位论文全文数据库 信息科技辑》,第11期,I138-979,公开日为2013年11月15日)公开,因此,权利要求2-5不具备专利法第22条第3款规定的创造性。3、权利要求6-8请求保护一种预测用户情感倾向的设备,分别对应于方法权利要求1-3,参见对权利要求1-3的评述,权利要求6-8不具备专利法第22条第3款所规定的创造性。
驳回决定所依据的文本为:申请日2014年12月12日提交的说明书第[0001]-[0238]段、说明书附图图1-25、说明书摘要、摘要附图;2017年12月14日提交的权利要求第1-8项。驳回决定所针对的权利要求书如下:
“1. 一种预测用户情感倾向的方法,其特征在于,包括:
确定至少一待评估文本;
根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,所述用户情感随时间演变的模型是根据每一个训练文本的文字向量、每一个训练文本的情感向量以及每一个训练文本的发布时间确定的,所述情感向量为用户预先阅读了每一个训练文本后产生的至少一种情感倾向;
其中,所述根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,包括:
对所述至少一待评估文本进行预处理,确定每一个待评估文本的文字向量和每一个待评估文本的情感向量;
将每一个待评估文本的文字向量中的每一个有效单词和每一个待评估文本的情感向量以及每一个待评估文本的发布时间绑定,得到每一个待评估文本的元组;
将所述每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感随时间演变的模型的输出结果,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。
2. 如权利要求1所述的方法,其特征在于,所述方法还包括:
建立所述用户情感随时间演变的模型。
3. 如权利要求2所述的方法,其特征在于,所述建立所述用户情感随时间演变的模型,包括:
确定至少一训练文本;
对所述至少一训练文本进行预处理,确定每一个训练文本的所述文字向量和每一个训练文本的所述情感向量;
根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训练文本的发布时间,确定用户情感随时间演变的 模型。
4. 如权利要求3所述的方法,其特征在于,所述根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训练文本的发布时间,确定用户情感随时间演变的模型,包括:
将第i个训练文本的文字向量中的每一个有效单词和第i个训练文本的情感向量以及第i个训练文本的发布时间绑定,得到第i个训练文本的元组;
对第i个训练文本进行统计,确定所述第i个训练文本中出现元组r的概率P(元组r|训练文本i);
根据所述P(元组r|训练文本i),通过一算法,确定第i个训练文本选择主题k的概率P(主题k|训练文本i)以及所述主题k产生元组r的概率P(元组r|主题k);
根据所述P(主题k|训练文本i)和所述P(元组r|主题k),确定任一文本产生任一元组的近似后验分布P(元组|文本)。
5. 如权利要求4所述的方法,所述确定任一文本产生任一元组的近似后验分布P(元组|文本),包括:
确定任一个文本出现任一主题的概率;
确定任一主题使用任一有效单词的概率;
确定任一主题产生任一情感倾向的概率;以及
确定任一主题产生于任一时间的概率。
6. 一种预测用户情感倾向的设备,其特征在于,所述预测用户情感倾向的设备包括:
一评估文本确定装置,用于确定至少一待评估文本;
一预测装置,用于根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,所述用户情感随时间演变的模型是根据每一个训练文本的文字向量、每一个训练文本的情感向量以及每一个训练文本的发布时间确定的, 所述情感向量为用户预先阅读了每一个训练文本后产生的至少一种情感倾向;
其中,所述预测装置包括:
处理模块,用于对所述至少一待评估文本进行预处理,确定每一个待评估文本的文字向量和每一个待评估文本的情感向量;
元组确定模块,用于将每一个待评估文本的文字向量中的每一个有效单词和每一个待评估文本的情感向量以及每一个待评估文本的发布时间绑定,得到每一个待评估文本的元组;
输入模块,用于将所述每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感随时间演变的模型的输出结果,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。
7. 如权利要求6所述的设备,其特征在于,所述预测用户情感倾向的设备还包括:
一建立情感模型的装置,用于建立所述用户情感随时间演变的模型。
8. 如权利要求7所述的设备,其特征在于,所述建立情感模型的装置包括:
确定模块,用于确定至少一训练文本;
预处理模块,用于对所述至少一训练文本进行预处理,确定每一个训练文本的所述文字向量和每一个训练文本的所述情感向量;
建模模块,用于根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训练文本的发布时间,确定用户情感随时间演变的模型。”
申请人(下称复审请求人)对上述驳回决定不服,于2019年02月20日向国家知识产权局提出了复审请求,并提交了权利要求书的全文修改替换页(共8项权利要求)。其中,在独立权利要求1和6中的特征“每一个待评估文本”前都增加了特征“所述至少一待评估文本中的”。修改的权利要求如下:
“1. 一种预测用户情感倾向的方法,其特征在于,包括:
确定至少一待评估文本;
根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,所述用户情感随时间演变的模型是根据每一个训练文本的文字向量、每一个训练文本的情感向量以及每一个训练文本的发布时间确定的,所述情感向量为用户预先阅读了每一个训练文本后产生的至少一种情感倾向;
其中,所述根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,包括:
对所述至少一待评估文本进行预处理,确定所述至少一待评估文本中的每一个待评估文本的文字向量和所述至少一待评估文本中的每一个待评估文本的情感向量;
将所述至少一待评估文本中的每一个待评估文本的文字向量中的每一个有效单词和所述至少一待评估文本中的每一个待评估文本的情感向量以及所述至少一待评估文本中的每一个待评估文本的发布时间绑定,得到所述至少一待评估文本中的每一个待评估文本的元组;
将所述至少一待评估文本中的每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感随时间演变的模型的输出结果,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。
6. 一种预测用户情感倾向的设备,其特征在于,所述预测用户情感倾向的设备包括:
一评估文本确定装置,用于确定至少一待评估文本;
一预测装置,用于根据一用户情感随时间演变的模型,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,所述用户情感随时间演变的模型是根据每一个训练文本的文字向量、每一个训练文本的情感向量以及每一个训练文本的发布时间确定的,所述情感向量为用户预先阅读了每一个训练文本后产生的至少一种情感倾向;
其中,所述预测装置包括:
处理模块,用于对所述至少一待评估文本进行预处理,确定所述至少一待评估文本中的每一个待评估文本的文字向量和所述至少一待评估文本中的每一个待评估文本的情感向量;
元组确定模块,用于将所述至少一待评估文本中的每一个待评估文本的文字向量中的每一个有效单词和所述至少一待评估文本中的每一个待评估文本的情感向量以及所述至少一待评估文本中的每一个待评估文本的发布时间绑定,得到所述至少一待评估文本中的每一个待评估文本的元组;
输入模块,用于将所述至少一待评估文本中的每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感随时间演变的模型的输出结果,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。”
复审请求人认为:1、在对比文件1的技术方案中,“博文M的关键词集合”与“情感向量EM”并没有任何形式的组合,能够类似于本申请的“待评估文本的元组”。对比文件1博文的关键词发布时间是不考虑的。对比文件1披露的技术方案中,仅仅能够得到随时间变化的情感,而什么时候发布的、什么样的文字会引起这样的变化,对比文件披露的技术方案是无法得到的。在对比文件1披露的技术方案中,至少不存在任何能够与“待评估文本”相等同的披露内容。2、对比文件3中的社会情感预测模型是基于情感标签的得分构建的,至少与“训练文本”以及“训练文本发布的时间”没有任何关联。
经形式审查合格,国家知识产权局于2019年02月26日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:在对比文件1中,训练文本和待评估文本的情感向量,其确定方式以及结构是相同的,“对于待分析的每条博文M,建立该博文的情感向量 EM=〈xM1,XM2,…,XMi,…〉,基于情感向量层次结构的每一层进行情感向量的时序分析”,也适用于训练文本。此外,对比文件3具有使得本领域技术人员有动机采用先建立预测模型,再分析待评估文本的模式,实现情感预测的启示。在该技术启示下,本领域技术人员有动机采用先建立预测模型,再分析待评估文本的模式,实现情感预测——即先建立分析情感随时间变化趋势的模型,再确定典型情感类别“同情”、“胆怯”“敬佩”等的情感分布,也就是根据用户情感随时间演变的模型,确定至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。因此坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。

决定的理由
(一)审查文本的认定
复审请求人在提出复审请求时提交了权利要求书的修改文本替换页(共8项权利要求),经审查,该修改符合专利法第33条和专利法实施细则第61条第1款的规定。因此,本复审决定所针对的审查文本为:申请日2014年12月12日提交的说明书第[0001]-[0238]段、说明书附图图1-25、说明书摘要、摘要附图;2019年02月20日提交的权利要求第1-8项。
(二)关于创造性
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,部分所述区别技术特征未被其他对比文件公开,也不属于本领域的公知常识,而且,所述部分区别技术特征能够为该项权利要求请求保护的技术方案带来有益的技术效果,则该项权利要求请求保护的技术方案相对于以上对比文件和本领域公知常识的结合具备创造性。
合议组在本复审决定中引用的对比文件与驳回决定中引用的对比文件相同,即:
对比文件1:CN103559233A,公开日为2014年02月05日;
对比文件2:“基于特征提取和主题模型的文本分类研究”,项珑,《中国优秀硕士学位论文全文数据库 信息科技辑》,第11期,I138-979,公开日为2013年11月15日;
对比文件3:CN102831184A,公开日为2012年12月19日。
本复审决定将对比文件1作为最接近的现有技术。
1、权利要求1要求保护一种预测情感倾向的方法,对比文件1公开了一种微博中网络新词抽取方法和微博情感分析方法,并具体公开了以下技术特征(参见说明书第[0007]-[0011]、[0056]-[0058]、[0086]-[0087]、[0092]-[0093]段,图3):该方法包括步骤1,确定情感向量E,所述情感向量E由多个能够表示情感的情感词构成;步骤2,对于待分析的每条博文M(即确定至少一待分析文本),建立该博文的情感向量EM=〈xM1,XM2,…,XMi,…〉(即对至少一待分析文本进行预处理,确定所述至少一待分析文本中的每一个待分析文本的情感向量);其中,如果情感向量E中第i个情感词属于该博文M的关键词集合(即文字向量,隐含公开了确定所述至少一待分析文本中的每一个待分析文本的文字向量),则EM中对应的第i个元素XMi取值为1,否则取值为0;步骤3,基于博文的情感向量来得到对事件的情感分布。为满足传统情感分析中的倾向性分析需求,还对每个情感词进行极性标注,分为积极、消极、中立三种情感倾向,如喜悦、感激、自信等属于积极情感,同情、羡慕、敬佩属于中立情感,怨恨、羞愧、心慌等属于消极情感等等(即情感向量为用户阅读了每一个文本后产生的至少一种情感倾向)。分别统计涉及各个事件的博文,分析在不同事件之间某个维度的情感分布。图3示出了在表3所示的6个事件上三种典型情感类别“同情”、“胆怯”“敬佩”的情感分布,竖轴表示每个事件中属于该情感的博文占与该事件相关的所有博文的比例。基于情感向量层次结构的每一层进行情感向量的时序分析,分析情感随时间的变化趋势,所述时序分析可以将情感向量按照时间粒度进行聚合,以分析情感随时间的变化趋势。
权利要求1要求保护的技术方案与对比文件1所公开的内容相比,区别技术特征为:(1)权利要求1的方法用于预测用户情感倾向;(2)根据一用户情感随时间演变的模型,确定至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率,所述用户情感随时间演变的模型是根据每一个训练文本的文字向量、每一个训练文本的情感向量以及每一个训练文本的发布时间确定的;将所述至少一待评估文本中的每一个待评估文本的文字向量中的每一个有效单词和所述至少一待评估文本中的每一个待评估文本的情感向量以及所述至少一待评估文本中的每一个待评估文本的发布时间绑定,得到所述至少一待评估文本中的每一个待评估文本的元组;将所述至少一待评估文本中的每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感随时间演变的模型的输出结果,确定所述至少一待评估文本中的任一文本令用户产生至少一情感倾向的概率。
基于上述区别技术特征,权利要求1实际解决的技术问题为如何预测用户的情感倾向。
对于区别技术特征(1),对比文件3公开了一种根据对社会事件的文字描述来预测社会情感的方法,并具体公开了(参见说明书第[0074]段):将描述社会事件的文本输入社会情感预测模型,得到与该社会事件相对应的情感标签排序,所述情感标签排序表示对该社会事件所预测的社会情感。可见,区别技术特征(1)已被对比文件3公开,且该特征在对比文件3中所起的作用与上述区别技术特征在权利要求1中的作用相同,都是对待评估文本进行情感预测。
对于区别技术特征(2),对比文件2公开了一种基于特征提取和主题模型的文本分类方法,并具体公开了(参见第4.2.2节):D.M.Blei 等人提出了 LDA (Latent Dirichlet Allocation)模型,这个模型引入了超参数,进而形成了一个三层贝叶斯模型即“文档一主题一词项”,然后根据一些概率统计方法对这些参数进行推导,挖掘隐藏在文本表明下的语义信息。LDA模型是对文本中隐含主题的一种建模方法,同样也是属于生成模型。其基本思想是可以随机的生成一篇有N个词项组成的文档,其中每一个词项都是由一定的概率选择一个主题,并从这个主题中以一定概率选择出来的。在对LDA进行建模时由于只知道p(w|Di),所以建模就是一个逆向的通过文档集集合来建立模型的过程,即文档集通过公式4-7推断等号右边的“词项-主题”和“主题-文档”向量的过程。对比文件2还公开了(第1.1节)文本情感分析与文本分类类似,但其目的却是对文本情感倾向进行判断,文本分类作为分析中一个重要的阶段,主要完成判断主观句还是客观句,在主观句前提下判断句子观点的功能。可见,对比文件2未公开用LDA模型预测用户情感倾向的具体方法,且其公开的LDA模型中的参数并不涉及训练文本的情感向量、训练文本的发布时间。
对比文件3公开了(说明书第[0007]-[0012]、[0020]、[0028]、[0047]-[0054]段)一种根据对社会事件的文字描述来预测社会情感的方法,进行的是从公众角度出发的社会情感研究,即预测社会公众对某一社会事件的情感倾向。预测结果不再是笼统的“褒贬”概括或是单一的情感类别,而是在多个情感标签上的排序。社会情感预测的目的是要学习出一个情感标签排序模型,该模型能预测一篇新闻报道所激发的网络大众的情感排序。方法包括构建情感标签序列的概率模型,通过利用训练集中每个样本及在其各个情感标签上的得分情况和情感标签排序情况,将情感标签序列空间的标签排序映射到概率空间的概率值;构建情感标签序列损失函数,通过所述的概率模型,在情感标签序列上构建损失函数,该情感标签序列损失函数表征排序模型输出的情感标签序列与真实情感标签序列的差异,通过优化该损失函数,得到社会情感预测模型。将描述社会事件的文本输入所述社会情感预测模型,得到与该社会事件相对应的情感标签序列。由上可见,对比文件3中的情感标签排序模型和权利要求1中的用户情感随时间演变的模型并不相同,对比文件3中的情感标签排序模型是基于训练样本在情感标签上的得分和情感标签排序情况构建的,而不是根据“训练文本的文字向量、训练文本的情感向量以及训练文本的发布时间”这样的组合来构建的。并且,对比文件3虽然可以预测社会公众对某一社会事件的情感倾向,但是,却不能预测随时间演变的社会公众情感倾向,因此对比文件3也未公开上述区别技术特征(2)。
因此,本领域技术人员根据对比文件2、对比文件3公开的内容难以想到构建如权利要求1中的用户情感随时间演变的模型并利用该模型预测用户情感倾向,即本领域技术人员根据对比文件2、对比文件3公开的内容无法获得将上述区别技术特征(2)应用于对比文件1中以解决权利要求1所解决技术问题的启示。
此外,上述区别技术特征(2)也不属于本领域的公知常识,且正是由于上述区别技术特征(2),为权利要求1的技术方案带来了能够预测未发表文本在不同时间可能引起的用户情感倾向并据此提供有针对性的服务的有益技术效果。因此权利要求1相对于对比文件1、对比文件2、对比文件3和本领域公知常识的结合是非显而易见的,权利要求1具有突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
2、在独立权利要求1相对于对比文件1、对比文件2、对比文件3和本领域公知常识的结合具备创造性的情况下,其从属权利要求2-5相对于对比文件1、对比文件2、对比文件3和本领域公知常识的结合也具备专利法第22条第3款规定的创造性。
3、权利要求6请求保护一种预测用户情感倾向的设备,其是和权利要求1的方法相对应的权利要求,参照对于权利要求1的评述,权利要求6也具备专利法第22条第3款规定的创造性。其从属权利要求7-8相应地也具备专利法第22条第3款规定的创造性。
(三)关于驳回理由和前置审查意见
对于原审查部门的驳回理由和前置审查意见,合议组认为:
对比文件1中,时序分析指的是在突发事件发生后,通过对博文的统计分析,得到突发事件与公众情绪之间的关联,得到过去一段时间内公众舆论的情感变化,其是对已发生的情感进行总结分析,确定已发生的情感的分布情况,该时序分析并没有建立用户情感随时间演变的预测模型,并不能实现预测功能。
虽然对比文件3公开了一种根据对社会事件的文字描述来预测社会情感的方法,但对比文件3中的情感标签排序模型和权利要求1中的用户情感随时间演变的模型并不相同,对比文件3中的情感标签排序模型是基于训练样本在情感标签上的得分和情感标签排序情况构建的,而不是根据“训练文本的文字向量、训练文本的情感向量以及训练文本的发布时间”这样的组合来构建的。并且,对比文件3虽然可以预测社会公众对某一社会事件的情感倾向,但是,却不能预测随时间演变的社会公众情感倾向。因此,本领域技术人员根据对比文件3公开的内容难以想到构建如权利要求1中的用户情感随时间演变的模型并利用该模型预测用户情感倾向,即对比文件1和对比文件3缺少结合的启示。
综上,合议组对于原审查部门的驳回理由及前置审查意见不予支持。
至于本申请是否存在不符合专利法及其实施细则的其他规定的缺陷,有待于后续程序进一步审理。

三、决定
撤销国家知识产权局于2018年11月05日对本申请作出的驳回决定。由国家知识产权局原审查部门以下列文本为基础对本申请继续进行审查:申请日2014年12月12日提交的说明书第[0001]-[0238]段、说明书附图图1-25、说明书摘要、摘要附图;2019年02月20日提交的权利要求第1-8项。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。




郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: