【华源原创】巧用关键词,提高专利标引效率
时间: 2021-06-28 10 北京康信华源知识产权咨询有限公司 柳涛 刘磊 阅读量:

专利标引,是将专利文献按照技术领域、技术分支、技术效果或创新发明点等进行分类整理,可用于科学信息库等数据库的构建,在企业的专利管理、专利分析、专利布局和专利预警项目中也有非常广泛的应用。常见的专利数据标引方法包括自动标引和人工标引。


自动标引为根据标题、摘要中的关键词或者分类号等信息批量标引,速度快但准确率低,特别是当技术特征具有较多表达方式时,自动标引会产生较大的噪音。


人工标引,则是标引人员通过需要阅读专利名称、摘要或权利要求书来理解专利技术内容并进行人工分类,对于部分技术方案复杂、表达方式晦涩的专利,往往还需要借助专利说明书进行理解,过程繁琐且耗时较长。


在日常工作中,企业IPR和知识产权服务人员常常需要对某个领域和范围的专利进行标引。


由于近年来专利申请量激增,专利标引的工作量也显著提高,如何在保证准确率的前提下,最大限度地提高标引效率,成为了专利工作中的“痛点”。


那么有没有方法将自动标引与人工标引有效的结合,取长补短,实现准确而高效的专利标引呢?答案是肯定的。


下面笔者分享一下利用关键词扩展提高专利标引效率的“小妙招”。


举例来说,检索得到一批专利,需挑选其中与“远程控制”相关的专利并将其标引至“远程控制”技术分支下。通常情况,应先从相关度较高的专利入手,如名称提及“远程控制”的专利,对此部分专利可经过快速筛选后标入相应的技术分支。


此后,根据相同的思路,我们可以从摘要、权利要求书或说明书中查找包含“远程控制”词组的专利,但是,与专利名称不同,专利的摘要、权利要求书和说明书可能包括更多与发明主题关系不十分紧密的信息,这样挑选出的专利只能算作“高度疑似”专利,需进行重点的阅读和标引。比如说明书的背景技术中提到“远程控制”,但专利具体内容并不涉及远程控制技术,那么这些专利则为不相关的专利文献。但是,将上述高度疑似专利一并处理,由于其具有更强的相关性,提高了阅读和标引效率,也减少了漏标的可能。


在上述两步结束之后,我们需考虑到关键词表达方式的多样性,如全文提到“远程遥控”而非“远程控制”字样的专利,同样需要进行重点阅读和标引。


所以我们需要尽可能地扩展与“远程控制”相似的词组,尽量全面地找到所有“高度疑似”专利。这一步可使用分词工具和EXCEL,大大提高关键词扩展效率和质量,以下是示例性的扩展流程。


筛选名称中含有“远程”的专利,得到名称列表

图片

利用分词工具,将名称分词

图片

利用EXCEL的数据透视表功能,统计高频词汇

图片

从高频词汇中挑选与控制相关字词,发现都含有“操”/“控”

图片


通过上面的关键词统计,我们发现采用“远程”+“控/操”的组合方式,可筛选得到更多与“远程控制”相关的专利,均为“高度疑似”专利。有一个值得注意的小技巧是,EXCEL的每一列中限定只能同时筛选两个词,所以不能直接在名称中筛选“远程”+“控/操”的专利,可以复制一列名称作为辅助列,这样可对于两个词进行同时筛选。


对于名称中含有“远程”+“控/操”的专利我们可以在快速筛选后直接标引,但是这些关键词出现在摘要、权利要求或者说明书的专利,还是需要重点阅读专利,以免出现错标。


可使用不同的关键词多次重复上述流程,若每次都可以获得更多的相关专利,则继续此过程;若经过多轮关键词扩展均发现无法获得更多相关专利,则可停止关键词扩展过程,遗漏“远程控制”相关专利的可能性已经大大降低。


在对所有技术分支均采用了上述流程进行标引之后,会遗留少部分专利文献,对此部分文献可进行最终的阅读和标引。


最后,建议在标引过程中及时回顾和检查,找到标引过程中判断的疏漏,以更好地完成标引工作。


综上所述,巧用分词工具和词频统计可扩展更多有效关键词,借助关键词可针对某个技术分支进行快速筛选和标引,不断重复上述步骤,可大大减少人工阅读的强度,提高标引效率。

关键词: 专利标引,专利文献,专利数据标引,人工标引,专利申请量,康信知识产权
康信·华源: 北京康信华源知识产权咨询有限公司是国内大型知识产权咨询公司,专注于专利挖掘及布局策划、技术研发咨询、 专利风险预警及应急救助 、知识产权许可、转让、知识产权战略策划等项目,为客户提供专业的综合法律、技术、管理的解决方案。
咨询电话: 010-56571586
返回顶部图标 分享

关注我们