网站导航免费论文 原创论文 论文搜索 原创论文 网学软件 学术大家 资料中心 会员中心 问题解答 原创论文 大学论文导航 设计下载 最新论文 下载排行 原创论文
返回网学首页
网学联系
最新论文 推荐专题 热门论文 素材专题
当前位置: 网学 > [完整论文]参考使用 > 参考论文 > 正文

网页信息抽取模块研制-微机应用专业论文

来源:http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 来源: 网络 发布时间: 16/02/15

【编者按】:网学网参考论文为您提供网页信息抽取模块研制-微机应用专业论文参考,解决您在网页信息抽取模块研制-微机应用专业论文学习中工作中的难题,参考学习。

微机应用专业论文,论文字数:8911,页数:24

摘  要

 垂直搜索引擎和普通的网页搜索引擎的最大区别是垂直搜索引擎对网页信息进行了结构化信息抽取,因此信息抽取技术成为了构建垂直搜索引擎的核心技术。本文首先简介4种Web的信息抽取技术,然后结合Jtree和Xpath技术来实现动态网页信息抽取系统.
关键字:信息抽取;垂直搜索引擎;结构化信息提取;JTree;XPath

Abstract

 The difference between  search engine and simple search engine is that Plumb search engine structed the file that catch,and the search information become the core technology to build the Plumb search engine.This article talk about four different technology for web search first,and then combine the Jtree with xpath to build this search system.
 
Keywords: Information search;Plumb search engine;structed information extraction;Jtree;xpath;

目  录

引 言 5
第一章 开发概述 6
1.1 研究背景和意义 6
第二章 Web信息抽取相关技术 7
2.1垂直搜索引擎中的信息抽取技术的选用 7
2.2 几种Web的信息抽取技术简介 7
2.3 JTidy简介 10
2.4 XHTML简介 11
第三章 系统分析与设计 12
3.1需求分析 12
3.2系统设计 12
3.2.1网页抓取功能 12
3.2.2 样本页转换成XHTML功能 12
3.2.3 XHTML转换成XML功能 13
3.2.4  XpathViewer解析器 13
3.2.5 XSLT解析器文件 13
3.2.6 提取信息 13
第四章 信息抽取系统的实现 14
4.1 解析页面并生成Jtree 14
4.2 抽取规则的生成算法生成 15
4.3 根据Xpath生成XSLT文件 17
第五章 试验 18
5.1 获取抽取页面并测试 18
总结 21
致谢 23
参考资料

网页信息抽取模块研制-微机应用专业论文......
  • 上一篇资讯: [参考论文]
  • 版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
    Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号