多级评分题组模型在《基于实物操作的老年人日常问题解决能力测验》中的应用.doc
《多级评分题组模型在《基于实物操作的老年人日常问题解决能力测验》中的应用.doc》由会员分享,可在线阅读,更多相关《多级评分题组模型在《基于实物操作的老年人日常问题解决能力测验》中的应用.doc(44页珍藏版)》请在沃文网上搜索。
1、目 录摘 要IAbstractII1 文献综述11.1 基于实物操作的老年人日常问题解决能力测验11.1.1 老年人日常问题解决能力的分类11.1.2 老年人日常问题解决能力的评估11.1.3 老年人日常问题解决能力的测量31.2 题组与局部试题依赖研究41.2.1 题组41.2.2 局部试题依赖51.3 题组反应理论的发展及等级反应题组模型71.3.1 题组反应理论的提出71.3.2 题组反应理论相关研究81.3.3 等级反应题组模型91.3.4 等级反应题组模型参数估计方法9 1.4 已有研究存在的问题及本研究的意义102 研究对象与方法122.1 测量工具122.2 研究对象122.3
2、问卷施测122.4 分析工具123 结果与分析133.1传统项目反应模型强假设检验133.1.1 单维性检验133.1.1.1 EFA检验测验单维性133.1.1.2 CFA检验测验维度143.2 传统项目反应模型项目参数估计153.2.1 传统项目反应模型项目参数估计153.2.1.1 区分度a参数分析163.2.2.2 难度b参数分析163.2.2.3 测验信息函数分析173.3 局部试题依赖性检验173.4 题组反应模型项目参数估计193.4.1 题组效果参数估计193.4.2 题组反应模型项目参数估计203.4.2.1 4题组反应理论区分度a参数分析233.4.2.2 10题组反应理论
3、区分度a参数分析233.4.2.3 4题组反应模型难度b参数分析233.4.2.4 10题组反应模型难度b参数分析233.4.2.5 4题组反应模型项目参数分析233.4.2.6 10题组反应模型项目参数分析243.5 题组反应模型被试能力参数估计243.6 题组反应模型参数对比253.6.1 区分度a参数对比253.6.2 难度b参数对比253.6.3 被试能力参数对比263.7 题组反应模型与传统项目反应模型参数对比263.7.1 区分度a参数对比263.7.2 难度b参数对比273.7.3 被试能力参数对比294 讨论314.1 项目反应理论基本假设检验314.2 基于实物操作的老年人日
4、常问题解决能力测验项目参数分析314.3 基于实物操作的老年人日常问题解决能力测验被试能力参数分析324.4 4题组反应模型与10题组项目反应模型参数估计对比324.5 题组反应模型与标准项目反应模型参数估计对比325 结论与展望345.1 研究结论345.2 未来研究方向34参考文献35附 录39致谢40摘 要随着现代心理与教育测量的发展,特别是自二十世纪五十年代以来项目反应理论的发展,测验编制的科学性越来越高。项目反应理论是建立在局部试题独立的强假设下,但随着具有局部试题依赖的题组题型的运用越来越广泛,项目反应理论对题组类测验的参数估计会出现偏差,此时应运用题组反应理论进行测验质量分析。目
5、前国内外对题组反应理论的研究多是模拟研究,实证研究非常少。本研究为考察基于实物操作的老年人日常问题解决能力测验的项目性能,采用基于实物操作的问卷调查法对450名60至84周岁的老年人进行实证研究,运用题组反应模型及传统项目反应模型进行数据分析。结果如下:(1)基于实物操作的老年人日常问题解决能力测验质量优良,该测验具有良好的区分度、难度;(2)基于实物操作的老年人日常问题解决能力测验符合单维性假设条件,即测验只测量老年人日常问题解决能力;(3)基于实物操作的老年人日常问题解决能力测验违背局部试题独立前提,统计量及题组效果结果显示项目间存在依赖性;(4)测验长度一定时,不管是4个题组的分类还是更
6、精细的10个题组的分类,题组反应模型参数估计结果基本一致,特别是被试能力参数估计结果几乎一样;(5)与题组反应模型相比,忽略项目间依赖性的传统项目反应模型会高估测验区分度、难度,而且明显高估被试能力,低估被试能力估计值的估计标准误。关键词:题组;局部试题依赖;题组反应模型;基于实物操作的老年人日常问题解决能力测验AbstractWith the development of modern psychology and education measurement, especially with the development of the item response theory since
7、the 1950 s, the testing construction is becoming more scientific. Item response theory is based on strong assumption of local indepentdent, but with the more widely using of testlets, item response theory to estimate the parameters of testlets will have some deviation, testlet response theory should
8、 be applied for test quality analysis at this point. At current, the researches of the testlet response theory both in domestic and overseas are mostly simulation study, very little empirical research. This study in order to investigate the quality of the questionnaire “Performance-based assessment
9、on the Chinese elders ability of everyday problem solving”, which is based on the observed task of daily living, surveying on 629 old people under the age of 60 to 84 in empirical study, using the testlet response model and traditional item response model for data analysis. The results are as follow
10、s: (1) Theresultsof items analysis is showing that the questionnaire“Performance-based assessment on the Chinese elders ability of everyday problem solving” has a good quality, the questionnaire has moderate difficulty and satisfactory discrimination. (2) The questionnaire meet the condition of Unid
11、imensionality hypothesis, namely the questionnaire only measures the elders ability of solving the everyday problems. (3) The questionnaire has breach the local independent premise, the results of Q3 index and (testlet effects var) show that the local item dependence exists within testlets. (4) When
12、 the questionnaire length is fixed, whether the classification of the four testlets or finer classification of 10 testlets, theparameterestimates of testlet response model are basically consistent, especially the ability parameter estimation results are nearly the same.(5) Compared with the testlet
13、response model, traditional item response model tends to overestimate the discrimination and difficulty of the test, obviously overestimate the ability parameter estimation and underestimate the standard error of ability parameter estimate. Key Words: testlet; local item dependence, LID; testlet res
14、ponse model; Performance-based assessment on the Chinese elders ability of everyday problem solving based on the observed task of daily living39赣南师范学院硕士论文1 文献综述1.1 基于实物操作的老年人日常问题解决能力测验我国已于1999年进入老年化社会,随着我国老龄化社会的到来,老年人健康问题,特别是老年人心理健康问题日益受到社会各界关注。日常问题解决能力是近年来老年人心理研究中比较活跃的领域之一,心理学研究日常问题解决能力主要考察个体对日常问题表
15、征的方式、采取的解决策略、解决的过程和解决的效果等(许淑莲、申继亮,2006)。目前,实践智力(Practical/Pragmatic Intelligence)、实践问题解决能力(Prac-tical Problem Solving)、日常问题解决能力(Everyday Problem Solving)、日常认知(Everyday Cognition)、日常能力(Everyday Competence)等都是指个体解决日常生活中所遇到的问题的能力。本研究中所使用的老年人日常问题解决能力的概念就是指老年人解决其生活中所必然面对的实际问题的能力,这种能力极大地影响着老年人生活质量及其身心健康。那
16、么老年人生活中会遇到哪些日常问题?怎样评估测量呢?1.1.1 老年人日常问题解决能力的分类日常问题解决涉及到生活中的多个方面,较为一致的看法是把日常问题解决分为完成活动任务和处理人际关系两种类型,也即工具性问题解决和人际性问题解决(Camp et al., 1989; Marsiske & Willis, 1995; Blanchard-Fields et al., 1997)。工具性问题解决(Instrumental Problem Solving),指的是个体从事对其生存具有工具性意义的实践性活动,如购物、服药、打电话、做饭等;人际性问题解决(Interpersonal Problem S
17、olving)主要涉及人际情绪情感因素,指处理在社会关系情境中产生的情绪情感反应的问题,如取悦妻子、消除夫妻间矛盾等。经典的工具性日常问题解决(Instrumental Activity of Daily Living, IADL)测验由服药、备餐、理财、打电话、洗衣、家务和出行七项任务组成, 并且每项任务都反映了日常问题解决能力的某一个方面。人际性问题解决由于涉及情绪情感等非理性因素,具有高度的复杂性及不确定性,是一种典型的结构不良问题,一般对人际问题解决主要采取定性分析的研究方法。在实际生活中工具性问题解决也可能涉及人际性问题解决,比如去菜市场买菜可能会和商贩讨价还价等。根据老年人实际生活
18、情境及中国国情,本研究使用的基于实物操作的老年人日常问题解决能力问卷中的日常问题解决能力不进行工具性和人际性问题解决的具体分类,总共包括服药、打电话、电器使用和理财四个方面。1.1.2 老年人日常问题解决能力的评估老年人日常问题解决能力的评估具有情境性、复杂性的特点。对于老年人日常问题解决能力的评估从最开始的从任务出发的自我报告法到本研究采用的从认知能力出发的基于实物操作的评估方法,大致可分为两类:一类是基于非实物操作的评估方法,包括自我报告法、代理报告法、纸笔测验法;一类是基于实物操作的方法。改进评估老年人日常问题解决能力的方法一直倍受重视,至今采用自我报告法仍占大多数(陈勃,2007)。自
19、我报告法是让被试完成自陈式问卷,即老年人根据自己实际情况评价自己的日常问题解决的能力等级或水平。这种评估方法施测简单方便,可以用于团体施测,但用此种方法的施测结果非常主观,身体健康或主观效能感高的被试倾向于高估自己的能力。为了避免这种主观倾向,有研究者采用代理报告法代替被试自我报告。代理报告也存在代理人主观倾向问题,代理报告人与被评分者关系好坏会影响评分的高低,并且他人在总体上倾向于低估年老者的能力(Diehl M, 1998)。 非基于实物操作测评老年人日常问题解决能力的评估方法除自我报告法及代理报告法外,还有一种以客观操作为基础的纸笔测验法。纸笔测验法一般是把说明书或图表以文字材料或图表材
20、料的形式在纸上呈现给被试,要求被试选出正确答案。实际上纸笔测验相当于让被试做阅读理解或数学应用题,一部分考查的是老年人日常问题解决能力,一部分考查的是被试的阅读理解及记忆思维能力。当被试做错时,也许是被试不理解题目意思,而非不具备这种问题解决能力。并且在作答过程中被试会产生一种陌生感或虚假感,纸笔测验不能反映被试解决日常真实情境下问题的效率。总而言之,纸笔测验只是一种对真实日常问题以书面形式表达出来的模拟,这种模拟和问题解决与客观实际可能会有一定差距。 Willis和Marsiske(1993)参考美国教育考试服务中心基本技能测验(ETS basic skills Tests)编制出的日常问题
21、解决测验(Everyday Problem-Solving Test, EPT)就是运用纸笔测验的形式评估老年人日常问题解决能力。另外,EPT 也有自评式的项目。我国也有研究者则将自我报告法与纸笔测验结合起来,李茵、王大华和申继亮(1997)编制的适合国内老年人的日常问题解决测验, 同样包括自评和操作两部分测验, 后一部分涵盖了老年人独立生活中的七项基本日常活动,如做饭、吃药、购物、邮寄等。上述自我报告法、代理报告法、纸笔测验法均不能真实全面的反映被试的日常问题题解决能力,越来越多的研究者主张根据被试的实际操作行为即被试的实物操作对其日常能力进行评估,如Diehl等(1995)在EPT基础上发
22、展起来的可观察的日常生活任务(Observed Tasks of Daily Living, OTDL)测验。OTDL测验有三项任务备餐、服药和打电话,施测时给被试呈现一些生活中的常见物(如蛋糕搅拌器、药品、电话本)作为刺激,要求被试通过现场操作完成9项做饭方面的任务,13项吃药方面的任务和9项打电话方面的任务,这些任务不是很容易就能完成,需要进行分析或推理。被试平均完成测验时间在40-60分钟,耗时较长。Diehl等(2005)对此问卷进行了修订,编制了可观察的日常生活行为问卷修订版(OTDL-R),将备餐一项改为理财, 项目也由原来的31项调整为9项,测试时间更短,任务难度分布范围扩大,效
23、度也符合心理学测验的要求。与非基于实物操作评估方法相比,基于实际操作评估方法的优点在于与老年人的生活实际及真实的问题解决任务更为接近,不仅保证了较高的内部效度,而且保证了拥有较高外在效度或生态效度(Allaire et al., 2009)。老年人日常问题解决能力与老年人日常生活的实际以及他们所处的自然环境、社会环境紧密关联,用国外的工具来评估中国老年人的日常问题解决能力其可适程度相当低微。因此,我国自主编制出的中国文化背景下基于实物操作的老年人日常问题解决能力问卷对考查我国老年人日常问题解决能力尤为重要。1.1.3 老年人日常问题解决能力的统计测量老年人日常问题解决能力的评估不管是自我报告法
24、、代理报告法、纸笔测验法,还是基于实物操作的评估方法,老年人日常问题解决能力的测量都是基于经典测量理论(Classical Test Theory, CTT),最为常用的就是平均数的比较、相关研究及测验信效度的测量。经典的真分数理论有三个方面的基本假设。假设一,真分数不变理论,即个体的特质恒定不变,具有稳定性。假设二,误差完全随机。假设三,观察分数是真分数与误差之和。相对于IRT的强假设,CTT的基本假设我们称之为弱假设。CTT虽然历史悠久,应用广泛,但CTT仍有很大的局限性。首先,测验统计量(测验的信度、效度)的样本依赖性。对同一项目而言,被试群体水平高,则测验难度估计值低,反之亦然。由于老
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于实物操作的老年人日常问题解决能力测验 多级 评分 模型 基于 实物 操作 老年人 日常 问题解决 能力 测验 中的 应用