关于大学毕业生就业情况的研究.doc
《关于大学毕业生就业情况的研究.doc》由会员分享,可在线阅读,更多相关《关于大学毕业生就业情况的研究.doc(16页珍藏版)》请在沃文网上搜索。
1、关于大学毕业生就业情况的研究目录摘要0一、问题提出2二、基本假设2三、建立模型及其检验、求解、评价2(一)问题1:确定影响大学生就业的主要因素2(二)问题2:评价不同专业毕业生就业情况7(三)问题3:给出某一专业毕业生的就业策略8(四)问题4:探讨毕业生就业情况与地区经济发展水平间的关系9(五)问题5:有关我校毕业生就业的意见10四、参考文献12五、附录121MATLAB操作示意图(一)122MATLAB操作示意图(二)123MATLAB操作示意图(三)12MATLAB操作示意图(一)0MATLAB操作示意图(二)0MATLAB操作示意图(三)1摘要本文探讨了在教育大众化的时代背景下,如何优化
2、大学生就业状况的问题。通过对影响大学生就业率因素的合理分析,我们在合理假设的基础上建立逐步回归分析模型,并求解模型给出具体排序情况,最后提出各项针对性建议。问题一:确定影响大学生就业的主要因素。首先,对影响毕业生就业的因素进行合理假设,设定只有性别、年龄、学历等十项因素对就业情况构成影响,并随机抽样选取样本。其次,引入虚拟变量将文字信息量化,得到数据矩阵。建立多元线性回归模型(Y = b0 + b1D1 + b2D2 + + biDi + )及逐步回归分析模型。最后,利用MATLAB软件中Stepwise(x,y,inmodel,alpha)命令对样本数据进行运算,求解模型,得出线性方程及相关
3、数据:判定系数R2 ,标准误差,相关系数r,F检验值。综合各指标得到影响就业率的主要因素为:课程是否适合社会、专业是否对口、政治面貌、专业前景、性别、年龄、初次学历。问题二:评价不同专业毕业生就业情况。在进一步假设的基础上选取样本数据,分别计算各专业的就业率、初始薪金均值及目前薪金均值,在作图比较的分析下给出客观评价。问题三:给出某一专业毕业生的就业策略。我们选定“经济学”专业毕业生作为研究对象,再次利用逐步回归模型,探究在该专业毕业生就业情况中起主要作用的因素,以此为依据就初始学历、专业是否对口等方面提出针对性策略建议。问题四:结合实际探讨毕业生就业情况与地区经济发展水平间的关系。在明确研究
4、背景的基础上,我们选取了八个不同城市作为研究对象,分别计算该地大学毕业生就业率,得出地区经济发展现状与就业率呈正相关的结论。问题五:对我校毕业生就业提出指导性建议。在本题研究成果的基础上,结合我校实际,分析了就业压力、自身期望、企业需求等方面的现存问题,从就业观、薪金要求、专业对口等几个方面给出就业指导建议。关键词:虚拟变量;回归分析;逐步回归模型;相关性系数一、问题提出随着我国大学教育逐步向大众化方向转变,招生数量连年增多,导致大学毕业生就业情况逐步严峻。2007年全国普通高校毕业生将达到495万,比2006年增加82万。大学毕业生的就业率高低,既有社会整体大环境的因素,也有专业结构、培养方
5、向、教学方式、学生学习态度等多方面的原因。附件给出了一个七千多名毕业生的调查数据,请你根据这些数据,建立相应的数学模型,研究以下问题:(1)影响毕业生就业的主要因素是什么,并对相关因素进行排序;(2)评价不同专业的毕业生就业情况;(3)给出某一专业的毕业生的就业策略;(4)请你结合其他信息对毕业生就业与区域经济发展水平之间的关系作出评价;(5)结合中央民族大学本科教育现状,写一篇对在校生今后就业具有实际指导意义的短文。21世纪是知识的时代,人才是国家发展的先决条件。大学毕业生的就业情况关乎社会发展状况与人才利用效率,通过数学模型的建立对影响就业率的各项因素进行深入分析研究,具有重大的实际意义。
6、二、基本假设在本次研究中做出以下假设:1假设毕业生就业情况只受性别、年龄、政治面貌、户口性质、初次学历、专业前景、专业是否对口、课程是否适合社会、初次月薪及目前月薪等十项因素的影响。2假设具有上述同等条件的毕业生间就业机会相同。3假设附件中的数据信息均合理。三、建立模型及其检验、求解、评价(一)问题1:确定影响大学生就业的主要因素1.1 问题分析与建模思想此题要在众多的就业率影响因素中选取主要因素,并对其进行排序。首先需要研究变量间的相关关系,多元线性回归分析模型可解决这一问题;但进一步的,我们希望从所有的影响因素中挑选出对就业率影响显著的项目,并且从应用的角度讲,变量个数尽可能少,而逐步回归
7、模型则可有效实现这一目标。逐步回归的基本思想是:先确定一个包含若干自变量的初始集合,然后每次从集合外变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,依此进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。当这一过程完成时,回归方程中所有自变量对因变量都是显著的。逐步回归的思想简明易懂,但具体运算操作非常复杂,我们可以利用MATLAB软件方便的实现这一思想。1.2 符号说明l Di:影响因素虚拟变量(i=1,2,3,20)l Yi:就业情况虚拟变量 (i=1,2,3,20)l Coefficients:相关性系数l R2 :判定
8、系数l F:显著性检验l P-value:F统计量对应的概率值l RMSE:剩余标准差1.3 建立模型 第一步:抽取样本考虑到数据总量庞大,从中抽取部分数据作为样本。我们采取简单随机抽样的方法,具体操作如下:1) 在EXCEL环境下对所有数据进行1-40的重复编号;2) 在“数据”菜单下选用“自动筛选”命令,选取所有编号为“1”的数据;3) 重复进行该操作若干次,最终选取19条数据作为研究样本。 第二步:引入虚拟变量在回归分析模型中,解释变量均为定性变量的模型称为方差分析模型(analysis-of-variance models)(ANOVA),本题即为此状。现建立人工变量,将定性变量“定量
9、化”,具体赋值情况如下:D1:性别虚拟变量,设D2:年龄虚拟变量,设 D3:政治面貌虚拟变量,设D4:户口性质虚拟变量,设D5:初次学历虚拟变量,设D6:专业前景虚拟变量,设D7:专业是否对口虚拟变量,设D8:课程是否适合社会虚拟变量,设D9:初次月薪虚拟变量,设D10:目前月薪虚拟变量,设Y:就业状况,设经过上述量化过程,样本数据排列为下面的矩阵形式:就业情况性别年龄政治面貌户口性质专业对口初次学历专业前景课程适合社会初次月薪目前月薪11113111111111121011011111211100000012101010111121111111010211110011013111111111
10、131111111111311111111103111101100130100001101200110010003101101100121011101000310100011113101000111031111110111100101011013101000 第三步:建立多元线性回归模型1本题需要研究各个因素与大学毕业生就业率之间的关系,故建立多元线性回归的一般模型:Y = b0 + b1D1 + b2D2 + + biDi + ,其中,b0 ,b1 ,b2 , ,bi 是未知数参数,b0 为回归模型的常数,为随机误差。假定 N( 0 , 2),即 E(y)= b0 + b1D1 + b2D2
11、 + + biDi . 第四步:引入逐步回归模型2进一步的,本题要求找出影响大学毕业生就业率的主要因素,即从若干变量中选取对就业率影响最大的几个因素,并使自变量个数尽量少。为实现这一目标,引入逐步回归模型。逐步回归模型的基本思想如前1.1节中所述,在此不再重复。本题中的因变量为就业情况,自变量为性别、年龄、初次学历等十个因素,具体符号及赋值见1.3节所述。实际操作中,我们主要运用MATLAB进行求解。 第五步:模型求解利用MATLAB软件进行模型求解。在MATLAB统计工具箱中的逐步回归命令是Stepwise,利用这个计算工具我们可以方便的完成回归变量的筛选工作。其通常的用法是Stepwise
12、(x,y,inmodel,alpha),其中:x是自变量数据,排成mn矩阵(m为自变量个数,n为每个变量的数据量);y是因变量数据,排成n1阶数据矩阵;inmodel是自变量初始集合的指标(即矩阵x中哪些列进入初始集合),缺省时设定为x的列数m;alpha为显著性水平,缺省时设为0.05.在本题中具体操作如下:1)将矩阵中的数据导入MATLAB程序,运用stepwise(D,Y)命令(根据缺省值,10个初始变量都进入初始模型),得到下图:图1 MATLAB操作界面2)由上图可以看出除D4和D10 外其他变量的回归系数置信区间都不包含零点,所以移出变量D4和D10 (相关系数与零无差异,即影响不
13、显著);我们规定线性相关系数系数低于0.7为线性不相关,则剩下变量D1,D2,D3,D5,D6,D7,D8,蓝色显示的变量D4,D10和相关性系数低于0.7的D9视为不相关。3)根据Y = b0 + b1D1 + b2D2 + + biDi + ,得到以下数据:b1=0.7895 b2=0.7673 b3=0.8930 b5=0.7445 b6=0.8374b7=0.9438 b8=0.9520Stepwise命令并未给出回归模型的常数bo 和随机误差,可以由以下方法计算得到:得bo+=-2.7770其中,分别是Y,D1,D2,D3,D5,D6,D7,D8的平均值,利用逐步回归最终得到的模型为
14、:Y=0.7895D1+0.7673D2+0.8930D3+0.7445D5+0.8374D6+0.9438D7+0.9520D8-2.77701.4 模型检验3以D1为例进行模型检验,具体情况如下:1)运用Excel的数据分析功能进行回归分析得到下表: 表1 EXCEL回归分析数据表回归统计Multiple R0.777844R Square0.605042Adjusted R Square0.549486标准误差0.61075观测值19方差分析DfSSMSFSignificance F回归分析110.2857110.2857127.574476.5E-05残差186.7142860.373
15、016总计1917Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept0#N/A#N/A#N/A#N/A#N/A#N/A#N/A政治面貌0.8571430.163235.251145.41E-050.514211.2000760.514211.200076 2)读表,得到各种检验结果如下: 标准误差 判定系数R2=0.605042 相关系数r=0.857143 F 检验值为27.57447综上所述,所得模型可以用于预测。1.5 问题解答根据上面得到的数据,我们可以得到以下结论:影响大学毕业生就业的主要因
16、素分别为(按影响作用大小排序):课程是否适合社会、专业是否对口、政治面貌、专业前景、性别、年龄、初次学历。1.6 模型评价l 该逐步回归模型具有以下优点: 逐步回归模型的思想简单易懂,且与本题要求甚为相符。 引入逐步回归模型可以免去多次重复计算多元线性回归,并且可以利用MATLAB软件简化运算。l 但由于处理水平有限,该模型有不可避免的局限性: 不能引进所有的变量。由于存在将定性变量定量化的困难,对于一些分类繁多的变量,如毕业院校、工作单位、具体毕业专业等,则无法引入该模型进行相关性分析。 数据容量有限,拟合出的方程精度不高,使得预测值与真实情况产生偏差。(二)问题2:评价不同专业毕业生就业情
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 大学毕业生 就业 情况 研究
