本文主要为广大网友提供“ 基于机器学习的类目映射方法——国际专利分类法与中国图书馆分类 ”,希望对需要 基于机器学习的类目映射方法——国际专利分类法与中国图书馆分类 网友有所帮助,学习一下!
互联网的迅猛发展,信息化的不断推进使得文献信息处理网络化、全球化已成为潮流,这为文献资源的共享创造了条件;与此同时,由于文献资源加工、处理方法及检索语言的多种多样,又为文献资源的共享带来了障碍。交叉浏览是指用户可以通过一种知识组织体系,可以浏览另一种体系中的信息,可以将不同体系中相同或相似的信息以某种方式呈现给用户,为用户提供一个集成式的服务,实现不同知识组织体系间的互操作。专利反映了解最新科研动态、研究课题开发现状、技术水平和法律状态。而期刊文献作为信息传递和交换的产物,是科研信息的重要来源。在专利信息越来越受关注的今天,实现专利与期刊文献的互操作以获取更加准确、详细、全面的信息具有重要的意义。
专利文献和期刊文献是按照不同的组织方式进行组织管理的,其中国际专利分类法(InternationalPatent Classification,IPC)是一种国际通用的管理和使用专利文献的工具,而中文期刊库以及其他中文文献信息则更普遍地使用中国图书馆分类法(Chinese Library Classification,CLC)。通过找到IPC与CLC类目间的映射关系可以实现这两种分类体系之间的互操作。国内外信息领域都已经致力于不同知识组织系统间的互操作研究,并取得一定的研究成果。例如,英国高层叙词表项目(High-Level Thesaurus Project,HILT),欧盟Renardus项目,我国山西省图书馆等联合研制了“计算机文献标引对照系统”,由戴剑波、侯汉清研制的CLC4和DDC21自动映射系统等。另外,国家“十一五”科技支持计划项目研究的知识组织系统是由多个领域词表构成的,每个词表包含了该领域的词汇,并且定义、规范了词汇间的各种语义关系,是该实验以及其他自然语言处理过程中的重要支撑工具。