量表评价系列|问卷和量表初步评价与探索性因子分析
公众号:医学大数据挖掘分析
01
问卷和量表有什么不同
问卷和量表都是收集数据的方式,尤其在心理学领域有重要应用,在编制上较为不同:
- 量表的编制需要有理论基础,各个条目都要与研究主题相关,每个题目答题方式一致,而问卷的题目只要符合主题,各部分不一定有关联,答题方式也可以多种多样;在计分中,量表通常以各分量表为单位进行求和等操作,按总分数计分,而问卷以各题为单位,按次数计分;在统计分析中,问卷多进行描述性统计分析,量表多进行因子分析,回归分析等。
举个例子,下面的SDS(抑郁自评量表)就是一个典型的心理测量量表,共20个条目分为4组特异性症状,每组包含若干题项,分别为精神性-情感症状,躯体性障碍,精神运动型障碍,抑郁的心理障碍,各组相关,每个题项都按四个等级评分,以各题项的得分统计(带*号的条目反序计分)得到结果。
02
初步评价
在分析之前,首先应对问卷或量表进行初步评价,就是信效度检验等。
1) 信度评价
- 重测信度:同一量表在同人群中测2次的相关系数,一般要在0.7以上,现实中难操作;分半信度:将量表条目随机分为两半,两个半表的相关系数为分半信度,稳定性较差;最常用的Cronbach’α系数。
2) 效度评价
有内容效度(通过专家评议),标准效度(与相关专业量表对比)和结构效度,常用验证性因子分析( Confirmatory Factor Analysis, CFA)和探索性因子分析( Exploratory Factor Analysis, EFA)的方法构建结构效度分析。
3) 反应度评价
对于特定目标特征可能随时间变化的量表,比如某病患者生活质量量表,可以通过反应度来评价,它能反映量表的敏感性。可以用配对 t 检验比较前后得分差别是否有统计学意义, 或者使用效应尺度(effect size)统计量评价反应度大小。
03
分析方法
初步评价后,问卷或量表成功地通过了信效度等检验的考验,就可以对它们的结果进行分析,根据量表的特性选择不同的分析方法,比如:
- 什么问卷量表都可以做的传统描述性统计分析;符合正态分布就可以做的均值差异t检验;有一定要求的因子分析(一种降维分析方法):探索性因子分析和适用于较成熟量表的验证性因子分析;回归等相关性分析;聚类分析……
上述分析方法一般都可以用SPSS,R或AMOS实现,其中因子分析在问卷量表中最为常用,我们首先来介绍探索性因子分析。
04
探索性因子分析和SPSS实现
1) 探索性因子分析
当我们刚刚设计好一份问卷或量表,有了一个雏形,可以用探索性因子分析建立模型框架。比如我们编制了一份调查问卷,设计了4个潜在变量,每个潜在变量对应3至5个题项。但实际上这些题项的关系不一定跟我们预设的一样,就可以通过探索性因子分析进行题项筛选和结构检验。
2) 分析步骤
- 计算题项间相关矩阵或协方差矩阵;提取因子(主成分方法、不加权最小平方法、极大似然法等);决定因子个数(参考特征根的大小、累计贡献率、碎石图等);转轴,通过因子载荷矩阵的变换使公共因子载荷更好看,方便解释;
# 结果需使每个题项仅在一个公共因子上有较大载荷。
3) SPSS实现
- 准备:在进行探索性因子分析之前,需对量表结构进行信效度检验。信度检验Cronbach’α系数应大于0.7,越大一致性越好;KMO值应大于0.6,也是越大越好;巴特利特球体检验中P值小于0.05可以拒绝原假设,否则不适合做因子分析,要修改题项;萃取公因子。一般采用主成分分析法,以特征值大于1的原则萃取公因子(适合于变量数10-30且共同性大于0.7的情况)。累计解释率应在50%以上;正交旋转。一般采用最大方差法,从旋转矩阵中删减指标,每删除一个重新进行一次分析,直到得到清晰的公因子。
4) 结果解释
现在我们有一份调查工人健康状况和生活质量的问卷,通过因子分析得到KMO统计量为0.745,巴特利特球体检验显著,6个因子的总贡献率为73.612%,较为理想,修改和删减成分分布太均匀的题项后得到旋转后的成分矩阵如下:
从成分矩阵中可以看出每个题项在各因子上的载荷,各题项对应的因子。值得注意的是在归纳因子时应看绝对值,有些载荷为负数,比如题项“您有多少时间觉得情绪低落、沮丧”在因子2上载荷绝对值最大,为-5.26,表示负相关。提取出六个公因子后,归纳公因子并命名(比如“您有多少时间感到心平气和”,“您有多少时间觉得情绪低落、沮丧”,和“您有多少时间感到精力充沛”被归纳到公因子2下,我们可以给它起个名字类似于“心理状态”),还可以进一步进行公因子内部一致性评价等操作,得到初步模型。
-END-
参考文献:
• 王文菁, 谭文艳. Zung抑郁自评量表的因子分析[J]. 广东医学, 2011(16).
• Zahoor, H.; Chan, A.P.C.; Utama, W.P.; Gao, R.; Zafar, I. Modeling the Relationship between Safety Climate and Safety Performance in a Developing Construction Industry: A Cross-Cultural Validation Study[J]. Environ. Res. Public Health 2017, 14, 351.
• Takaki J, Taniguchi T, Fujii Y. Reliability, validity, and significance of assessment of sense of contribution in the workplace[J]. Environ Res Public Health. 2014;11(2):1594–1604.
• Janke C. ten Holt, Marijtje A. J. van Duijn & Anne Boomsma. Scale construction and evaluation in practice: A review of factor analysis versus item response theory applications. Psychological Test and Assessment Modeling, Volume 52, 2010 (3), 272-297.
• Hinkin, T. R., Tracey, J. B., & Enz, C. A. (1997). Scale construction: Developing reliable and valid measurement instruments[Electronic version].
更多问题,请关注“医学大数据挖掘分析”公众号,联系我们~
邮箱:medicalda@tp-data.com
地址:广州市天河区珠江东路高德置地秋广场F座返回搜狐,查看更多
责任编辑: