【华源原创】医药&化学领域文献检索方法大盘点!
时间: 2020-08-25 11 北京康信华源知识产权咨询有限公司 邵小丹 刘磊 阅读量:

众所周知,医药&化学技术领域的研发周期比较长,前期投入也比较大,所以研发人员通常会在前人基础上做二次研发,这样就可以相对节约些时间和成本,这就使得医药&化学技术领域的文献资源在研发中尤为重要。


那么,如何更好地检索获取这些资源以进行利用,就成为了该领域研发工作的关键环节。


不同于其他技术领域,医药&化学领域的物质名称冗长,并且同一物质有可能会有多种截然不同的命名方式,在某些情况下,即便命名方式相近,其名称也会有个别字词的差异。


这就使得检索过程有更多的不确定性,检索中更容易遗漏关键信息,检索效率也会相应降低。


因此,在医药&化学领域的检索过程中,除了采用关键词、分类号和申请人等常规手段检索文献外,通常还会对化学结构式、CAS登记号和生物序列等善加利用,这样则可大幅提高检索效率,保障检索全面性。


化学结构式&CAS登记号

虽然医药&化学中物质名称多种多样,但其化学结构式和CAS登记号往往是唯一的,使用化学结构式和CAS登记号代替物质名称,能够非常高效地获得最为相关的文献资料。


包含化学结构式检索入口的数据库包括STN、SciFinder、Reaxys Beilstein、PATENTSCOPE、国家知识产权局专利检索系统、PubChem和智慧芽等。


其中STN和SciFinder数据库收录了专利、论文等多种文献,数据较全且检索体系成熟,具有强大的化学结构式编辑功能,尤其能够构建和表达包含杂环、不确定键、重复单元等结构的马库什化学式,但STN和SciFinder数据库检索成本较高、具有一定的使用门槛。


而PATENTSCOPE、国家知识产权局专利检索系统和PubChem为免费数据库,使用起来更为便捷。


下面以PubChem为例,简单介绍如何通过化学结构式进行检索。


下图为Pubchem的检索界面,点击Draw Structure进入结构式编辑界面,绘制二环己胺化学结构式并进行检索。



检索结果按照完全匹配、具有相似结构和包含该子结构等不同相关度分别显示出来,如下图所示。



点击具体分类,既可以看到该种物质的结构、名称和CAS登记号等基本信息,也可以看到以目录形式呈现的相关文献列表,进一步点击文献链接可以浏览和下载文献内容。



CAS登记号是化合物、高分子材料、生物序列、混合物或合金的唯一数字识别号码,使用CAS登记号进行检索同样可以高效地获得相关文献。


通过Anychem、Chemicalbook、Chemblink和CommonChemistry等可查询物质CAS登记号(见下图所示),继而使用REGISTRY、STN、Scifinder、CAplus和Reaxys等数据库,可通过CAS登记号进行文献检索。



以Reaxys数据库为例,在检索界面中输入水杨酸CAS登记号69-72-7,可获得涉及水杨酸的制备、反应等多种技术角度的文献信息。




生物序列

核酸和氨基酸等物质是医药&化学领域中特有的物质类型,生物序列是该种物质的唯一标识,是进行该种物质检索时的重要检索入口。数据库NCBI提供了生物序列检索功能,其包括BlastTp、BlastTn、BlastTx等多个程序,其程序的适用类型及检索方法见下图所示。



下图为Blast的检索界面,以一种抗体(具体序列如下图中所示)为例,由于检索的序列为蛋白质序列,因而选择Blastp程序进行检索。



下图为检索结果界面,其中展示了检索结果并且列出了检索结果与目标序列的匹配情况,在该界面中还可对结果进行二次筛选。点击结果中的匹配序列,可以进一步查询包含该序列的文献。



关键词

前面说的医药&化学领域的专有检索入口虽然可以提高获得最相关文献的效率,但是通过专有入口检索往往存在文献覆盖不全的缺陷,那么仅使用专有入口进行检索,就会有遗漏部分相关文献的风险。


关键词是各技术领域通用的检索入口,同样也适用于医药&化学领域的检索,采用关键词进行检索是对采用专有入口检索的必要补充。


针对医药&化学领域的特点,在使用关键词进行检索时,需要注意以下几点:


1、充分扩展物质名称


化合物或组合物名称的表达方式包括药用名、常用名、俗名、缩写和分子式等,通过Chemicalbook、Patbase、Wikipedia、Chemspider、PubChem、Scifinder、Orangebook和百度百科等入口可以进行查询其表达方式。例如通过查询,甲基丙烯酸羟乙酯可扩展为HEMA、甲基丙烯酸羟乙酯、2-羟基乙基-2-甲基-2-丙烯酸酯、2-羟基乙基甲基丙烯酸盐、甲基丙烯酸2-羥乙酯和C6H10O3等。


2、巧用临近算符和截词符


在构建检索式时,使用临近算符和截词符可以有效简化检索式,避免遗漏和错误。例如,构建2-羟基乙基-2-甲基-2-丙烯酸酯的检索式时,为了涵盖其可能的表达方式,可使用临近算符将其表示为“羟基乙基 Near 甲基 Near 丙烯酸酯”进行检索;再例如,构建acetylsalicylate和acetylsalicylic acid的检索式时,可使用截词符将其合并表示为“acetylsalicyl*”进行检索。


3、注意上位表达方式


在检索某个具体的化合物或组合物时,需要充分考虑它们的上位名词。例如,奥比妥珠(Obinutuzumab)抗体的上位表达方式包括单克隆抗体、抗CD20抗体等,并且该抗体为一种人源化抗体,且经过糖基化修饰,也被称为第三代抗体,因此该关键词的上位表达可为“单克隆抗体、抗CD20抗体、人源化抗CD20抗体、第三代CD20抗体和糖基化抗体”等,使用这些上位表达的关键词进行检索,可以保证检索的全面性。


研发机构

在医药&化学领域中,公司和研究所等研发机构的技术延续性较为突出,因而在进行检索时,需要更加密切关注相关研发机构的文献情报。


例如,罗氏集团在抗肿瘤单抗产品方面的研发较为突出,该公司的抗体药物,如曲妥珠单抗、利妥昔单抗、贝伐珠单抗等,牢牢占据单抗药物的大量市场份额。因此在检索该类药物相关主题时,细致分析罗氏集团的专利及期刊文献是必不可少的。


需要注意的是,以研发机构作为检索入口时,要充分考虑研发机构的集团组织架构、企业并购、联合开发等信息,还要考虑不同的外语/中文翻译名称等。例如,在对罗氏集团进行检索时,除了考虑罗氏集团本身外,还要考虑其旗下的罗氏投资有限公司、上海罗氏制药和罗氏诊断产品公司等研发机构。


总结

从上面的介绍可以看出,医药&化学领域的检索对检索人员来说具有一定的挑战性,其中检索策略的制定、检索入口的选择以及检索要素的表达是十分关键的。通过利用该领域特有的化学结构式、CAS登记号和生物序列等检索入口,可以有效提高检索效率,提高检索的准确性;同时还需使用关键词和研发机构进行检索,采用有针对性和技巧性的检索要素扩展,与高效准确检索形成有效互补,保证检索的全面性。


北京康信华源知识产权咨询有限公司,是国内一线的大型知识产权咨询公司,专注于专利挖掘及布局策划、技术研发咨询、专利风险预警及应急救助、知识产权许可、转让、知识产权战略策划等项目,为客户提供专业的综合法律、技术、管理的解决方案。

邮箱:ip-consultants@kangxin.com
电话:010- 56571586


关键词: 医药化学领域,专利检索,专利文献检索,知识产权,华源
康信·华源: 北京康信华源知识产权咨询有限公司是国内大型知识产权咨询公司,专注于专利挖掘及布局策划、技术研发咨询、 专利风险预警及应急救助 、知识产权许可、转让、知识产权战略策划等项目,为客户提供专业的综合法律、技术、管理的解决方案。
咨询电话: 010-56571586
返回顶部图标 分享

关注我们