Title网站群系统及系统中关键词提取模块的设计与实现
Authors高翔
Affiliation北京大学
Keywords网站群系统
网站群管理
关键词提取
序列挖掘
Issue Date2008
Citation北京大学.
Abstract本文根据当前国内电子政务网站群系统的建设现状和发展趋势,在网站群系统的设计上做了深入的研究,结合国内电子政务建设的特点,设计和开发了一个符合国内电子政务发展现状的网站群系统。首先介绍了网站群系统的相关知识和采用的技术,接下来对电子政务中网站群系统的需求进行分析,给出了系统的功能和模型框架的设计,然后介绍了系统的实现。系统综合运用面向对象的设计思想、组件技术、数据库连接池等相关知识开发设计,较好的满足了系统的可靠性、扩展性、可重用性,本系统的使用将大大减轻电子政务领域建立各类信息网站的复杂性,提供了一个方便高效、低成本的网站群管理平台和信息发布共享平台,有着良好的发展前景。<br>   此外,本文还详细介绍了系统中的关键词提取模块,模块采用序列挖掘的方法提取文档关键词。首先用改进的PAT树技术为文档创建一个树存储结构,然后结合净频率计算方法和互信息计算方法挖掘文档中频繁出现的字串,最后通过各种权重选取字串作为文档关键词。实验表明,序列挖掘方法能从文档中很好的提取出人命、地名、新词和常用词组,模块达到了预期的目的。<br>
URIhttp://hdl.handle.net/20.500.11897/374742
Appears in Collections:学位论文

Files in This Work
There are no files associated with this item.

Web of Science®



Checked on Last Week

百度学术™



Checked on Current Time




License: See PKU IR operational policies.