本文主要为广大网友提供“ 电子政务叙词表向本体转化的方法与实例研究 ”,希望对需要 电子政务叙词表向本体转化的方法与实例研究 网友有所帮助,学习一下!
随着我国电子政务建设工作的不断深人,数字化信息的生产速度不断加快,政府数字化信息占信息总量的比例越来越高,政务信息资源的总量急剧膨胀。政府部门需要对自身的信息资源进行有效开发和科学组织,才能让这些资源高效服务于各级政府机构、社会公众。由于电子政务中的信息资源在内容、形式、存储介质和传输手段等方面具有一定的特殊性,常规的文件、主题树、数据库和超媒体等组织模式对政务信息资源的组织效果都不十分理想。本文通过分析叙词表在我国电子政务信息资源组织中应用,比较电子政务中的叙词表和本体的区别与联系,探讨由电子政务叙词表向电子政务本体转换的可能性和具体方法,为有效组织电子政务中的信息资源提供有益的参考。
电子政务中叙词衰的应用1.1叙词表的概念与应用特点叙词表又称为主题词表,它是一种语义词典,由术语及术语之间的各种关系组成,能反映某学科领域的语义相关概念,它较适用于等级结构领域,如:事物、主题、地点和学科等的名称。ANSI(美国国家标准学会)的Thesauru。标准(239.191980)规定有13种词汇间关系,例如常见的“用、代、属、分、参”结构。叙词表的主要用途是使查询者输人系统的词条与索引编撰者使用的词条相匹配,是提高查全率和查准率、实现多语种检索和智能化概念检索的重要途径。叙词表的使用要点主要有数据录人时,利用主题词可进行正确性校验或选择规范化的主题词进行标引,或进行上位词的自动录人;(2)检索过程中,可根据主题词表中词汇间的关系实施交互式的导航检索过程,或选择相关的主题词进行检索。
电子政务系统中叙词表的应用通过对所有入库资源进行科学标引、描述与分类,利用叙词严格的语义内涵和位属关联,建立规范的政务叙词表,能够对电子政务中各类信息产品和服务过程起到基准性、规范性、参照性的支持作用。叙词表在政府网站浏览和检索功能中的潜能已经被越来越多的学者和研究机构所认可,加章大、澳大利亚、英国和新西兰等国家都已编制了本国的电子政务主题词表。我国政府也于2(X)2启动了电子政务主题词表标准化项目,组织制定了国家标准《电子政务主题词表编制规则》,编制了《综合电子政务主题词表(试用本))[zlo我国的《综合电子政务主题词表(试用本)》共收录主题词 20252条,其中正式主题词 17421条,非正式主题词2831条。范畴索引划分为21个大类,132个二级类,远多于世界上其他国家的电子主题词表的主题词数。《综合电子政务主题词表(试用本)》注意兼容我国已有的《公文主题词表(中办)》和《国务院公文主题词表》,充分考虑将来专业性电子政月晌.田裔门业务研究务主题词表与综合表兼容的问题,内容覆盖了我国电子政务各领域及相关知识范畴,包括党派团体活动、理论研究、政治思想工作、理论宜传等相关方面,是目前国内外收词量最多、专业搜盖面最广、人口率最高的政务主题词表。该词表的问世,对加速我国电子政务工程建设,规范电子政务信息管理,实现电子政务信息资源共建共享,具有深远的意义。
虽然《综合电子政务主题词表(试用本)》体系结构完整,收录范围也较为全面,但对于电子政务中专业领域的应用来说,它们所收录的主题词的深度还远远不够,如果要充分发挥主题词表在电子政务中的作用,还需制定相关的专题主题词表。在这样的背景下,深圳市国土资源和房产管理局以《综合电子政务主题词表(试用本)》为核心,以国土资源和房产领域里已有专业主题词表为蓝本,结合具体业务,遵照《电子政务主题词表编制规则),最终编制出《专题电子政务主题词表》,为电子政务中专题主题词表的编制提供了一个案例,起到了一定的指导和示范作用[3]。
13叙词表在电子政务中应用存在的问题叙词表中语义关系描述并不严格,而且也不是完全遵守同一种逻辑来划分,在计算机处理时会有语义逻辑上的缺陷。而且叙词表在电子政务中使用时,需要对标引人员进行一定的培训,才能够使其掌握主题词及后组配的标引方法,从而保证正确地组配词语。同时叙词表中泛指的词会产生大且的搜索结果,影响了检索效率和检索质量。而通过建立电子政务本体,形成电子政府的知识地图和专业化的电子政务门户网站,有助发现新的知识增长点和新的政府功能结合点,优化电子政务流程,从而克服叙词表在电子政务应用中的不足,促进政府由信息管理型向知识服务型转变。本文所属栏目http:///electron/
2叙词表和本体的区别与联系叙词表和本体之间的主要区别叙词表和本体之间的差异主要是表现在逻辑表达、组织结构、体系更新、语义关系和包含内容等方面。叙词表由情报人员负责编写,其中的术语均是规范的科学语言;本体一般由领域专家参与建立,对概念之间的关系描述更加详尽具体,能够反映学科内在联系,学术性、专业性更强,其中的概念、术语可以用自然语言和半自然语言来表达。这是二者在逻辑表达形式上的区别;在组织结构上,叙词表中知识点的分布是线性的、一维的;本体中的知识点、概念分布是网状的,它可以不单纯是一张平面的网格,而是一个在四维空间中伸缩的网状结构;叙词表是从传统纸质文献环境发展起来的,相对稳定,结构保守而单一,不可能经常修订;本体是网络信息环境下产生及发展起来的,是一个开放集成的体系,它的底层知识库与概念集可以随着学科领域的更新和发展随时进行修正和更新;叙词表提供术语词汇列表以及参照系统显示词间关系,包含“用、代、属、分、参、族”这样的简单的语义关系。本体中概念间的关系,则被描述得更为广泛、深人、细致和全面。不仅仅显示术语及其内在关系规则,它在术语表中定义了一系列有关对象和关系的类,而内在的关系规则不但表达不同词汇之间的等同、从属和相关关系,而且提供一种推理的机制;叙词表是从表达主题概念的词汇人手,从非规范词指向规范词,但它只是一个词汇库(语料库),不是知识库;本体不仅仅是概念集、语料库,还可以是一个知识库。一部叙词表可以说只是一个原始的本体,那么一个实际存在的本体还可以是一个自备知识库或知识底层的完备的知识组织体系,具有智能查询、回答用户问题、机器翻译和预测知识增长点等传统的基于叙词表的检索系统不具备的功能。(本论文由网学http:// 整理提供,如需转载,请注明出处或联系我们的客服人员)