中文文献检索系统的与开发.doc
《中文文献检索系统的与开发.doc》由会员分享,可在线阅读,更多相关《中文文献检索系统的与开发.doc(38页珍藏版)》请在沃文网上搜索。
1、目 录1 引言11.1 开发背景11.2 开发目的和意义11.3 文献检索背景知识22需求分析52.1 可行性分析52.2 功能分析52.3 系统实体联系图63 系统设计93.1 系统总体规划93.2 概要设计93.2.1 系统总体功能模块图93.2.2 系统的业务流程103.3 数据库设计113.3.1 管理员数据库设计113.3.2 用户数据库设计113.3.3 文献数据库设计123.3.4 文献类别数据库设计123.3.5 目录结构123.3.6 数据库关系图124 主要功能设计144.1 通用模块144.2 登陆模块144.3 用户注册模块154.4 用户信息修改模块154.5检索模块
2、154.6 文献上传模块184.7 文献修改模块194.8 用户管理模块194.9 系统简介模块195 主要问题及解决方法215.1 主要问题及解决方法215.2 待改进的方面226结束语23参考文献24致谢25附录26Contents1 INTRODUCTION11.1 DEVELOPMENT BACKGROUND11.2 DEVELOPMENT AIM AND BACKGROUND11.3 LITERATURE RETRIEVAL BACKGROUND KNOWLEDGE22 SYSTEM ANALYSIS52.1 FEASIBILITY ANALYSIS52 .2 FUNCTION AN
3、ALYSIS52 .3 SYSTEM ENTITY CONTACT FIGURE63 SYSTEM DESIGN93.1 System Overall Planning93.2 Constructional Design93.2.1 System Function Module Diagram 93.2.2 System Business Process103.3 Database Design113.3.1 Administrator Database Design113.3.2 User Database Design113.3.3 Literature Database Design12
4、3.3.4 Document Categories Database Design123.3.5 Directory Strcture123.3.6 Database Relationship Chart124 THE MAIN FUNCTION DESIGN144.1 GENERIC MODULE144.2 LANDING MODULE144.3 USER REGISTRATION MODULE154.4 USER INFORMATION MODIFY MODULE154.5 RETRIEVAL MODULE154.6 LITERATURE UPLOAD MODULE184.7 LITERA
5、TURE REVISION MODULE194.8 USER MANGEMENT MODULE194.9 SYSTEM INTRODUCTION MODULE195 THE MAIN PROBLEMS AND SOLUTIONS215.1 THE MAIN PROBLEMS AND SOLUTIONS215.2 STAY IMPROVED226 CLOSING23REFERENCES24 ACKNOWLEDGEMENT25APPENDIX26中文文献检索系统的设计与开发2007级网络工程四班 A 指导教师 *【摘要】本系统是一个简单的中文文献检索系统,采用B/S架构,.NET的开发平台;其开发
6、主要包括后台数据库的建立和维护以及前端应用程序的开发两个方面,采用SQL Server为后台数据库、Visual C#编程语言作为前台开发语言。本系统主要是实现用户注册、用户登录、信息修改、检索文献、在线预览文献、下载文献的用户功能,检索文献主要分为综合检索、按字母检索、按类别检索三类;管理员登陆、文献上传、文献删除、文献更新、文献修改、用户信息的删除等管理员功能。基本上可以满足中小型文献管理部门的信息化管理工作。【关键词】文献检索系统;Visual C#;SQL ServerThe Design and Development of the Chinese Literature Retrie
7、val SystemXu YanjieLi Weiyan【Abstract】This system is a simple chinese literature system, by B/S architecture,.NET development platform ;Its development contains two handles: The creation and maintenance of the background database and the future applications.It adopts SQL Server database as backgroun
8、d database,Visual C# programming language as future development tools.The system is mainly to reach the function of user registration、user login、information modifying、retrieval literature、literature online preview、download documents etc administrator function,search literature is divided into compre
9、hensive search,alphabetical search,search by category three;administrator landing、literature upload、literature delete、literature update、document revision、deletion of user information etc administrator function. Basically to meet the document management sector, small and medium sized information mana
10、gement.【Key words】Chinese literature retrieval System;Visual C#;SQL Server山东农业大学学士学位论文1 引言1.1 开发背景 文献检索1是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,又称“信息的存储与检索(Information Storage and Retrieval)”。在计算机尚未在文献管理部门广泛使用之前,检索和获取过程主要依靠手工。一个最典型的手工处理过程就是:用户将前往文献资料中心,根据自己的检索内容通过手工缓慢查找的方法,找到相关的文献资料,这将耗费大量的人力和时间,之后将借阅
11、证交给工作人员,工作人员进行记录,这样获取文献的过程就完成了。以上所描述的手工过程的不足之处显而易见,首先检索的效率很低,其次处理能力比较低,一段时间内,所能服务的用户人数是有限的,并且同一个文献只能同时被一个用户借阅并使用,不能处理并发多用户需要同一文献资料的冲突情况。利用计算机来处理这些流程无疑会极大程度地提高效率和处理能力。人们要适应这个信息社会,必然和web信息打交道,但这样大量且还在指数上升的信息是人们变得茫然,如何从浩瀚的信息海洋中以较低的代价和较高的效率筛选信息,甄别信息,成为一个突出的问题;同时,Internet作为开放、分布的信息空间,其本身固有的特点也阻碍了人们充分利用In
12、ternet上的信息资源。因此,人们迫切需要一个真正意义上的、能以一定的策略在互联网上搜集、发现信息,对信息进行理解、提取、组织、处理并为用户提供检索服务,具有信息导航作用的工具,来帮助他们迅速、高效的找到所需的全部信息。本课题就是利用Internet的现有网络资源和已有的庞大电子文献资料库设计一个基于B/S模式的文献检索系统,用于改善传统检索的现状,帮助在校学生、老师、科技人员等更便捷、快速的获得相关的文献资料和信息知识。1.2 开发目的和意义在传统的手工文献检索中,科技文献的标引和检索都是人工完成的,随着电子文献的增多,手工处理文献已经显得力不从心,为了对大量的文献进行自动的处理,需要从文
13、献的标引到检索都用计算机进行处理,使文献处理的数量和速度都大大增加,信息检索系统经过几十年的发展,取得了长足的进展,实现了很多信息检索系统,从基于简单好用的布尔模型系统,到基于向量空间模型和概率模型的检索系统等,使信息检索的精度不断提高,但是不同的检索系统面对不同的文献会显示出不同的性能。中文科技文献2和其他文献比较,有自己的特点:用词规范;在不同级别的刊物上发表的文章,对检索者的相关程度一般不一样,刊物的级别越高,其相关程度越高;科技文献的结构也比较标准,结构清晰等。为了提高信息检索系统的针对性,对现有检索系统进行改进以适应中文科技文献,是很实用和必要的。从而提高中文文献检索系统的性能。搜索
14、引擎3的实现目标就是满足Internet所有用户的需要,用户可以足不出户的检索文献,同时信息要具有实时性、真实性、有效性等特点,这就要求搜索系统的索引数据库及时、准确、有效的更新,与此同时还需给用户提供简洁、优美的操作平台,方便用户更有效地利用系统功能模块,进而达到在最短的时间内获得最大限度的有效数据的目的。学校信息主要语言为简体中文,因此我们初步完善中文信息搜索系统功能。本课题的目的是设计一个基于B/S模式文献检索系统,主要内容和模块包括:文献数据库的建立,用户的管理,登录身份的管理,文献的查询和检索,文献的上传和下载,文献检索策略的制定和实现,文献资料的后台管理。本课题要求学生掌握的主要相
15、关的知识和技术有:数据库的原理和技术,某一数据库管理系统(sql),网站开发技术,动态网页制作技术,软件工程的方法等。1.3 文献检索背景知识文献分为4零次文献、一次文献、二次文献、三次文献。零次文献指未经正式发表的或未形成正规载体的一次文献的形式;一次文献指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作;二次文献指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累计起来的工具性文献。三次文献指对有关的一次文献和二次文献进行广泛深入的分析综合概括而成的产物。文献检索语言5有分类语言、主题语言、关键词语言
16、、自然语言等。分类语言是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言;主题语言指经过控制的,表达文献信息内容的语词;关键词语言指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词作为索引和查找图书资料的工具;自然语言指文献中出现的任意词。文献搜索途径有著者途径、题名包括书刊名等途径、分类途径、主题途径、引文途径、序号途径、代码途径、专门项目途径等。著者途径指利用索引从著者、编者、译者、专利
17、权人的姓名或机关团体名称顺序进行检索的途径;一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录;分类途径指按学科分类体系来检索文献;文献所附参考文献或引用文献,是文献的外表特征之一,利用这种引文而编制的索引系统,称为引文索引系统,他提供从被引论文去检所引用论文的途径,称为引文途径;依编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径称为序号途径;代码途径指利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索;专门项目途径指从文献信息所包含的或有关的名词术语、人名、地名等的特定顺序进行检索,可以解决某些特别的问题。文献检索方法6有直接法、顺查法、倒
18、查法、抽查法、追溯法、循环法等方法。直接法又称常用法,指直接利用检索系统检索文献信息的方法;顺查法指按时间顺序,由远及近地利用检索系统进行文献信息检索的方法;倒查法指由近及远、从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法;抽查法指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;追溯法指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文,然后在从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环的追查下去的方法。循环法是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。文献检索步骤:
19、(1);明确查找目的与要求。(2):选择检索工具。(3):确定检索途径和方法。(4):根据文献线索,查阅原始文献。检索工具7有(1):目录、索引、文摘目录。(2)百科全书,参考工具书之王。(3):年鉴,按年度系统汇集一定范围内的重大事件、新进展、新知识和新资料,供读者查阅的工具书。(4):手册名录是汇集经常需要查考的文献、资料、信息及有关专业知识的工具书。(5):词典是最常用的一类工具书。(6):表谱、图录。(7):类书、政书。文献检索的类型:数据检索:以文献中的数据为对象的一种检索;事实检索:以文献中的事实为对象,检索某一事件发生的时间、地点或过程;文献检索:以文献原文为检索对象的一种检索,
20、手段为:手工检索、计算机检索。42需求分析2.1 可行性分析可行性分析是在进行初步调查后所进行的对系统开发必要性和可能性的研究,所以也称为可行性研究。本系统也应从技术可行性,经济可行性和社会可行性三方面来论证8。通过一段时间的观察与实践,我认为文献检索系统的可行性分析如下:(1)经济可行性分析作为文献检索系统这样的小型在线管理系统,其经济成分比重相对较少,主要是支出的费用:其中包括服务器设备购置费、软件开发费用、管理和维护费、人员工资等。由于文献管理系统实行管理员统一操作,系统共享,人员工资,维护费用相对较少,前期的资金投入主要集中于购置服务器设备上。(2)技术可行性分析技术上的可行性分析主要
21、分析现有技术条件能否顺利完成开发工作,硬件、软件配置能否满足开发者的需要,各类技术人员的数量,水平,来源等。文献检索系统的工作主要是在用户和文献内容之间架起一座桥梁,能随时随地获取自己所需的文献资料。这一特点非常适合计算机特点,通过网络Internet技术,发挥计算机的信息传输速度快、准确度高的优势。计算机硬件和软件技术的飞速发展,为系统的建设提供了技术条件。(3)社会可行性分析社会可行性有时也称为操作可行性,主要论证新系统在企业或机构开发和运行的可能性以及运行后可能一起的对企业或机构的影响,即组织内外是否具备接受和使用新系统的条件。在当前信息技术飞速发展的大环境下,计算机技术和软件技术的更新
22、使文献管理机构完全有可能也有能力采用这样先进的管理技术。它对文献检索带来的影响可以看到:对传统管理理念的冲击,可能引起管理层的变动和人员的调整。对文献管理工作人员的要求提高,使文献管理机构在一定的可能下进行精简,迫使工作人员继续学习新知识。2.2 功能分析抽象出当前系统的逻辑模型。在理解当前系统“怎么做”的基础上,抽取其“做什么”的本质,从而从当前系统的物理模型抽象出当前系统的逻辑模型。在物理模型中有许多物理因素,随着分析工作的深入,有些非本质的物理因素就成为不必要的负担,因而需要对物理模型进行分析,区分出本质的物理因素就成为不必要的负担,因而需要对物理模型进行分析,区分出本质的和非本质的困素
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中文 文献 检索系统 开发