数据统计及展现的解决方案研究生论文.doc
《数据统计及展现的解决方案研究生论文.doc》由会员分享,可在线阅读,更多相关《数据统计及展现的解决方案研究生论文.doc(57页珍藏版)》请在沃文网上搜索。
1、山东大学硕士学位论文目录摘 要IABSTRACTIII第1章 绪论11.1 选题背景11.2 高校研究生数据统计研究现状21.2.1 研究生管理信息系统功能描述及数据统计重要性21.2.2研究生管理信息系统数据统计研究现状及存在的问题31.3 本文的主要工作51.4 本文的组织结构6第2章 研究生数据统计需求分析72.1研究生学籍情况数据统计分析72.2研究生就业情况数据统计分析82.3研究生数据统计展现方式分析9第3章 数据统计过程103.1 数据仓库的概念103.1.1 数据仓库的产生103.1.2 数据仓库的基本概念103.1.3 数据采集概念113.2数据统计介绍123.2.1 多维数
2、据模型相关概念123.2.2 数据统计流程介绍153.3 研究生数据统计详细过程173.3.1 研究生数据统计模型构建183.3.2研究生数据统计ETL实现203.3.2.1数据抽取过程213.3.2.2数据的清洗与转换273.3.2.3 数据的装载过程31第4章 统计数据输出334.1 Excel格式报表实现统计数据的输出334.2图表格式实现就业数据输出38第5章 总结与展望42参 考 文 献44致 谢46ContentsABSTRACTIABSTRACTIIIChapter 1 Introduction11.1 Background11.2 Statistics of graduate
3、education research21.2.1 Postgraduate management information system function description and the importance of statistical data21.2.2 Research objective and problems in statistical data of postgraduate management information system31.3 Primary contens of this thesis51.4 Thesis structure6 Chapter 2 S
4、tatistical analysis of graduate students data72.1 Statistical analysis of graduate school data72.2 Statistical analysis of graduate employment data82.3 Analysis of statistical research data show way9Chapter 3 Statistical process103.1 The concept of data warehouse103.1.1 The generation of data wareho
5、use103.1.2 The basic concept of data warehouse103.1.3 The concept of data acquisition113.2 Introduction of statistics123.2.1 Multidimensional data model concepts123.2.2 The process of data cleaning and conversion153.3 3.3 The details of the post-graduate statistics process173.3.1 Establishment of th
6、e model of postgraduate statistics183.3.2 ETL implement graduate statistics203.3.2.1 Data extraction process213.3.2.2 The process of data cleaning and conversion273.3.2.3 The process of data loading31Chapter 4 Output statistics statistics334.1 Excel format output334.2 Chart format output38Chapter 5
7、Conclusions and prospect42References44Acknowledgments46iii摘 要随着科学技术的发展,信息化、数字化风暴席卷全球,各大高校纷纷采用计算机平台进行日常办公、人事管理等。这些业务系统为我们的生活带来便利的同时,也存储了丰富的业务数据1。在这个信息爆炸的时代,从海量业务数据中挖掘出有效的、新颖的、潜在有用的、最终可理解的信息,并将这些抽象数据直观形象地展现给用户,以支持用户进行数据分析和行政决策,成为目前校园信息化建设的一项巨大的工程。本文在对国内外数据统计研究现状分析的基础上,结合本校的实际,提出了一套符合本校需要的数据统计及展现的解决方案。
8、研究生数据统计以山东大学研究生管理信息系统为背景,通过引入创新的数据统计模型进行有效的数据统计。统计工作面向研究生管理信息系统各类用户的需求,为教育事业分析预测提供准确依据,满足学校管理人员和教育事业研究人员对山东大学研究生各方面数据的需求。 本文以ETL过程为主线,描述了山东大学研究生在学籍和就业方面的数据统计过程。统计过程涉及数据的抽取、数据的清洗和转换、数据的加载三个阶段。经过以上三个阶段的预处理,源数据被转换成准确、规范的格式以报表的形式进行展现。在需求分析中,首先分析了研究生数据统计的重要性和目前存在的问题,明确了研究生数据统计的必要性;其次,引入多维数据模型的相关概念,解决了统计结
9、果的存储问题;再次,分别描述了研究生学籍和研究生就业的数据统计过程;最后,介绍了统计数据的展现方式。在数据统计过程中,首先介绍了数据仓库的概念和特点,着重分析了数据仓库的产生原因、数据仓库的基本概念和数据采集的相关知识;其次分析了数据统计的重要性,并介绍了数据统计的流程;最后以研究生就业数据的统计为例,详细描述了数据的ETL过程。在统计数据输出阶段,介绍了一种面向客户的统计数据查询和展现方法,并针对不同用户对数据格式的不同需求,将数据的展现分为Excel、饼状图和柱状图三种模式。最后以上述三种模式展现了山东大学研究生学籍和就业的统计数据。当前山东大学研究生数据统计工作已经完成,统计结果已经按照
10、要求展现,统计数据准确有效,为学校研究生管理人员和国家教育事业研究人员进一步分析预测提供了依据。关键词:数据统计;ETL;多维数据模型;报表展现ABSTRACTAs science and technology development, information technology and digital storm sweeping the globe, major universities have used computer platforms to do routine office and personnel management. These business systems co
11、nvenient our lives, and also stores a wealth of business data 1. In this era of information explosion, mining an effective, novel, potentially useful and ultimately comprehensible information from a massive data, and visually display the abstract data to the user, to support users to implement data
12、analysis and administrative decision-making, becomes a large project of the campus information construction. This paper based on the analysis of the status of domestic and foreign statistical research, combined with the actual school, proposed a set of statistics and display solutions to meet school
13、 needs.Graduate statistics is based on the backgrounds of the Shandong University graduate management information systems, which adopts advanced design concept and builds a series of statistical process. The statistical work is oriented to the various users of the graduate management information sys
14、tem, whose goal is to provide accurate forecasts and effective basis for the national education. And the results meet the needs of national education researchers and the relative administrators of Shandong University on all aspects. This paper takes data ETL process as its main line, talking about t
15、he Statistical Process of specific data at the aspect of Shandong University graduate student status and employment. At the same time, it describes the process of statistical data analysis for some relevant requirements, which involves data extraction, data cleansing and conversion and loading data.
16、 After the three stages of statistical data pre-processing, statistical data is transformed into accurate and standardized data format and is stored into the corresponding data warehouse in the Multidimensional data model.First, we elaborate on the importance of graduate statistics and current probl
17、ems in our requirement analysis, and then introduce the concept of multidimensional data model to describe the relevant results of the storage problem. After that, we respectively describe the statistical process of all cases of graduate student and graduate employment in detail. And we describe the
18、 relationship between the relevant business forms, the specific data extraction process and the data storage model. Finally, we introduced the data output of the specific ways.After a series of statistical processes, we have to show statistical results to the user before the end system. For the diff
19、erent needs of data formats from various users, we show the data output model in the format of Excel, pie charts and bar charts. In the realization stage, we introduce the report generation system for specific functions and export processes. And the final result of the statistical data is showed in
20、the three formats that we talked about above.Now, the statistics of Shandong University graduate has been completed. And the final results have been showed in the format of user needs. The statistics is accurate and effective, which provides scientific basis to National education researchers and Sch
21、ool administrators for further analysis and forecasting.Keywords: Statistics; ETL; Multidimensional data model; Reports show;III第1章 绪论1.1 选题背景为了更好的对全国教育事业进行分析预测,国家每年都会对全国各高校研究生情况进行相关统计,需要统计的信息涉及高校研究生各方面情况,包括学籍信息,招生管理信息,就业信息等。为了配合国家对这些信息的需求,学校研究生院每年都会对当年在校研究生情况进行统计。而近年来,随着高校研究生数量的增加,学校对研究生信息统计的工作量加大,
22、使得相关的数据统计工作难度增大,对数据统计的技术也要求更高。本文就是在这种背景下对数据统计的主要工作进行分析研究。高校研究生信息统计是研究生教育的一个重要环节,是一项涉及多部门协调工作的统计过程。学校研究生部的工作非常繁杂,信息采集工作涉及学生的来源、招生、入校、学习、生活、论文、成果、毕业等各个方面,工作主要包括数据录入、数据处理、信息输出和数据导出等。统计数据经过处理后以适当的形式输出相关文件或表格,如高等学校研究生信息基本表,包括在校学生年龄情况表、学生来源情况表、学生变动情况表等,另外还有学生就业信息统计表,包括研究生就业单位分布表、就业流向表等,然后将处理后的数据按一定格式上报教育部
23、。就目前而言,大量信息的管理,仍以手工处理为主,除纸质的材料外,所谓信息处理往往以Excel报表为载体,存储在计算机的大量文件中。学校研究生部急需一套承上启下、包容和协调日常大量业务处理和数据存储、分析的综合信息统计方法。在山东大学研究生管理信息系统中有在全国范围内统一的信息采集规范,使得上报工作有法可依。但是由于面向的用户不同,对学校而言,学校级客户端面对该校每一个应届研究生,使用该客户端,只能采取专人负责手工输入每个学生个人信息的办法,既费时费力又容易出错。要弥补系统中的这种缺陷,就需要有针对性的建立既适用于我校研究生学生管理工作流程,又能很好的适应国家对于信息搜集要求的数据统计方法。这样
24、可以修改小部分的数据结构,在学生入学时即导入尽可能完整、格式正确的信息,有必要采用B/S结构实现信息的分散采集的方法,在日常信息管理时就包含国家统计所需要的信息,通过学校级的系统数据筛选导出可直接为国家对研究生信息统计所用的完整、准确的数据文件。研究生信息数据统计工作就是以山东大学研究生管理信息系统的相关业务为背景进行的。1.2 高校研究生数据统计研究现状高等学校研究生教育数据统计是在高校管理信息系统背景下对在校研究生在统计当年相关数据的统计,随着计算机软硬件技术、通信技术及信息处理技术一级信息处理技术的高速发展,管理信息系统(Management Information System, MI
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 统计 展现 解决方案 研究生论文
