建设目标

科技知识组织体系建设和示范应用是建设创新型国家的需要,巩固国家科技文献信息战略保障的需要,适应科研环境和用户需求变革的需要,适应世界科技信息技术发展的需要,促进我国信息处理领域科技创新的需要,也是国家科技文献共享平台可持续发展的需要。

建设我国科技知识组织体系,开展基于科技知识组织系统的应用示范和关键技术研发,将有利于更好地开发利用NSTL已经拥有的科技文献资源,为政府决策部门、科研管理部门、科研机构、大专院校和企业提供深度科技文献知识服务,对于加快我国信息产业整体服务能力的提升,支撑我国信息处理领域的科技创新,推动科技信息服务模式的转变,促进国家科技文献共享平台信息资源效益的充分发挥,具有重要意义。

项目的建设目标是,采用国际上先进的知识组织技术和方法,借鉴国内外已有的知识组织系统建设成果与应用经验,争取在“十二五”期间基本建成面向计算机应用的科技知识组织体系,为我国海量外文科技文献信息的组织和利用提供支撑,实现国家科技文献信息战略资源的有效组织、深度揭示和知识关联,提供知识检索服务,推进基于国家科技文献信息战略资源的知识发现、知识挖掘和知识计算应用示范,整体提升我国科技文献信息机构的知识服务能力。

建设内容

超级科技词表预计收集科技词汇素材约1000万条,收录科技术语不少于500万条,科技概念规范名称80万条,其中理学领域科技概念规范名称20万条,工学领域20万条,医学领域30万条,农学领域10万条。在十二五前三年争取收词量达到上述目标的70%,初步建成具有一定规模的统一的超级科技词表;初步建立本体构建的方法、机制和工具集,并在此基础上,面向十二五国家科技重大专项,选择4-5个学科方向,围绕重大专项中的热点、难点、重点问题,构建4-5个领域本体;完成科研本体的总体框架设计、标准规范制定,并开展应用示范。

研究内容

主要包括建设以领域本体为目标的外文科技知识组织体系;开发科技知识组织体系辅助建设工具,搭建的协同工作环境;建成科技知识组织体系共享服务平台;开发基于科技知识组织体系的海量文献信息自动处理和智能检索系统;开展知识服务应用示范;探讨高效灵活的大规模真实科技文献文本语义计算方法,开发有效的文本语义计算工具;开展《汉语主题词表》(以下简称《汉表》)与英文超级科技词表基于概念的映射研究,探讨中英文双语检索的途径。围绕建设目标,项目拟设置以下七个研究课题:

课题一、面向外文科技文献的超级科技词表和本体建设

课题二、科技知识组织体系的协同工作系统和辅助工具开发

课题三、科技知识组织体系共享服务平台建设

课题四、面向外文科技知识组织体系的大规模语义计算关键技术研究

课题五、信息资源自动处理、智能检索与STKOS应用服务集成

课题六、基于STKOS的知识服务应用示范

课题七、《汉语主题词表》(工程技术版)与英文超级科技词表的映射研究

上述课题关系密切,彼此倚托,相互促进。课题一是整个项目的建设重点和关键,是能力提升和服务模式拓展的必不可少的基础设施。课题二为课题一搭建可协同建设的工作环境和提供应用工具,课题四为科技知识组织体系建设和应用示范提供必要的技术支撑。课题三提供面向公众、第三方机构的知识组织体系的共享服务,课题六提供基于知识组织体系的面向科研创新、科技决策支持的服务应用示范。课题五将通过对国家科技文献共享平台主体海量文献信息的基于知识组织体系的自动标注,实现国家科技文献信息战略资源的有效组织、深度揭示和知识关联;通过建立新型智能检索系统,推进基于国家科技文献信息战略资源的知识发现、知识挖掘和知识计算应用,全面知识服务能力,使公众普遍受益。课题六为基于STKOS选择若干学科方向开展热点发现检测跟踪、学术关系构建等增值服务应用示范。课题七为通过《汉语主题词表》(工程技术版)与英文超级科技词表的映射,更好地支持跨语言检索和中英文资源的集成揭示。

课题一由中国科学院文献情报中心牵头承担;

课题二由中国医学科学院医学信息研究所牵头承担;

课题三由中国科学院文献情报中心牵头承担;

课题四由中国科学技术信息研究所牵头承担;

课题五由中国科学技术信息研究所牵头承担;

课题六由中国农业科学院农业信息研究所牵头承担;

课题七由中国科学技术信息研究所牵头承担。