面向外文科技文献的超级科技词表和本体建设

简介

针对国内文献信息机构开展知识服务的需要,开展了科技知识组织体系(STKOS)及相关知识组织体系的建设,初步建成了1部基于1,438万个科技术语、609万个基础术语,拥有61万个概念的超级科技词表,构建了植物多样性、可再生与可替代能源技术、水稻、呼吸系统肿瘤等4个领域本体和1个包含65万个实例的科研本体知识库,构建了NSTL科技术语范畴体系。针对建设中面临的知识产权问题进行了深入研究,并提出了相应解决方案,为后续科技文献信息通用本体建设奠定了基础,在很大程度上促进了我国知识组织与知识服务理论与实践的发展,具有较为广泛的应用前景。在课题建设过程中,培养了5名博士研究生,11名硕士研究生,以及一大批专业骨干人员,发表学术论文42篇。 查看详细

科技知识组织体系的协同工作系统和辅助工具开发

简介

面向STKOS内容建设需要,开展了STKOS协同工作系统体系架构、网络协同构建模式、异构词表统一描述与存储、术语/概念自动归并、术语自动翻译、资源协同管理、本体演化、内容质量控制等关键技术研究;完成了STKOS素材库协同构建与管理系统及其辅助工具、STKOS基础词库协同构建与管理系统、STKOS概念协同构建与管理系统、STKOS范畴协同构建与管理子系统、STKOS本体协同构建与管理系统的及其辅助工具的开发与应用集成;完成了“超级科技词表辅助加工系统”、“范畴体系协同构建与管理系统”2个计算机软件著作权的登记;在国内外核心期刊上发表了学术论文17篇。 查看详细

科技知识组织体系共享服务平台建设

简介

课题的建设目标是基于科技知识组织体系(STKOS),构建支持我国科技界、科技信息服务机构和信息处理领域实现科技知识组织体系(STKOS)有效利用的开放式服务环境。 查看详细

课题研究内容

为了有效利用"科技知识组织体系(STKOS)",让"科技知识组织体系"在我国科技界、科技信息服务机构和我国信息处理领域的科技创新中发挥作用,需要建设一个可靠的"科技知识组织体系共享服务平台"。 查看详细

课题成果说明

STKOS开放知识组织引擎系统是一个能够有效对外提供服务的、开放的知识查询和推理引擎,可以通过标准的接口协议,实现知识组织体系的深度开发和利用。 查看详细

课题成果应用前景

课题建设了一系列的有自主知识产权的软件系统,如科技知识组织体系(STKOS)的发布服务系统、科技知识组织体系(STKOS)相关工具的集成服务系统、第三方信息服务系统中STKOS的检索应用示范系统,服务于我国知识组织体系建设的需要。查看详细

面向外文科技知识组织体系的大规模语义计算关键技术研究

简介

本课题产生的成果包括概念词汇和分类体系规范以及结构化计算;非结构化科技文本的语义角色标注和语义关系标注,包括细粒度的句子内级别的关键技术和篇章级别的关键方法技术研究,为STKOS的概念体系建设和领域知识库建设提供自动化方法和工具。 查看详细

成果报告

本课题的主要目标是: 本课题的总体目标是通过概念词汇的结构化计算以及非结构化科技文本的语义标注关键技术研究,为STKOS的概念体系建设和领域知识库建设提供自动化方法和工具。通过开发和集成相关的软件工具,为我国科技文献的微观、中观和宏观层面(词汇、概念、短语、句子、篇章、专题、全库)的语义分析提供技术方法支持。同时为未来科技文献的移动知识服务进行前瞻性研究和布局。 查看详细

成果说明

(1)数据集(含语料库)2项包括如下: 语义标注语料库:是对皮肤病中文语料300万字做了分词,词性标注,句法分析,浅层语义分析,深层语义分析后的语料库资源。 领域词典:皮肤病领域的词汇资源 细粒度的问答知识库:百度问答数据。 查看详细

信息资源自动处理、智能检索与STKOS应用服务集成

简介

课题建设目标是基于NSTL数字资源平台,利用STKOS及工具,研究海量信息自动处理和智能检索关键技术,基本建成文献信息自动处理系统;初步建成NSTL智能检索系统,并投入面向全国的用户服务。 查看详细

课题研发背景及目标

NSTL的建设和发展是国家科技创新体系和国家科技基础条件平台建设的重要组成部分,也是国家信息基础设施建设不可或缺的核心机构,NSTL网络服务平台的不断升级完善集中体现了网络环境下文献信息资源共建共享的管理体制和运行机制的持续发展与变革创新,在面向全国科技界提供科技信息资源保障,支撑国家科技创新和经济社会发展中发挥了重要作用。 查看详细

课题架构与技术路线

课题设计基于海量文献信息自动处理及STKOS的文献服务平台。采用STKOS与统计相结合的抽取方法,整合句法分析、语料学习、标引经验等多种技术融合的方式探讨英文科技文献中知识特征项的抽取机制,从海量西文科技文献资源的标题、摘要、著者、著者单位、基金资助等信息中分领域抽取科技术语、科研主体、科研领域、科研产出、科研设备等科研要素特征项。 查看详细

基于STKOS的知识服务应用示范

简介

以NSTL海量科技信息资源和项目建成的STKOS为基础,从STKOS中进行知识片断的抽取,形成领域知识库与应用本体实例库,在此基础上,进行了热点主题识别、突发主题识别、知识结构与知识演化分析、学术关系网络分析、科研本体等知识挖掘分析算法和模型研究,集成了数据清洗、数据挖掘和可视化等通用技术和工具。 查看详细

课题概况

NSTL作为我国科技文献资源战略性保障体系,经过十年的建设和积累,在科技文献资源采集、建设、保障方面取得了长足发展,累积的各类资源数量已超过一亿条。 查看详细

课题成果

热点主题是指在科技领域中,随着时间推移,逐渐引起人们关注、并被越来越多学者研究的研究领域。热点主题具有以下特征:在特定时空内引起了某研究领域学者们的普遍关注;发表的相关文章达到一定的数量;发表相关研究主题的期刊达到一定数量,热点主题将持续出现一定时间,与该主题相关的研究明显增多。 查看详细

成果应用

目前,课题研究部署的应用示范系统,已经面向"肿瘤"、"水稻"等领域开展了初步应用示范。课题组已经与北京协和医院,医科院基础所、儿研所、中科院植物所、中国农科院水稻所等组织机构的多类用户进行了需求调研、宣传推广、系统试用和交流反馈。 查看详细